PCT/E POO/02893 



TENT COOPERATION TRE 



From the INTERNATIONAL BUREAU 



PCT 

NOTIFICATION OF ELECTION 

(PCT Rule 61.2) 


To: 

Commissioner 

US Department of Commerce 
United States Patent and Trademark 
Office, PCT 

2011 South Clark Place Room 
CP2/5C24 

Arlington, VA 22202 
ETATS-UNIS D'AMERIQUE 

in its capacity as elected Office 


Date of mailing (day/month/year) 

11 December 2000 (11.12.00) 




International application No. 

PCT/E POO/02893 


Applicant's or agenfs file reference 


International filing date (day/month/year) 
31 March 2000(31.03.00) 


Priority date (day/month/year) 
31 March 1999 (31.03.99) 


Applicant 

RAUHE, Hilmar et al 



1. The designated Office is hereby notified of its election made: 

| X | in the demand filed with the International Preliminary Examining Authority on: 

26 October 2000 (26.10.00) 



| | in a notice effecting later election filed with the International Bureau on: 



2. The election | X | was 

| | was not 

made before the expiration of 19 months from the priority date or, where Rule 32 applies, within the time limit under 
Rule 32.2(b). 



The International Bureau of WIPO 


Authorized officer 




34, chemin des Colombettes 


Pascal Piriou 


1211 Geneva 20, Switzerland 




Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 


Form PCT/IB/331 (July 1992) 


EP0002893 



L 



PATENT COOPERATION TREATY 



WO 00/5991 
PCT/EP00/02 



From the INTERNATIONAL BUREAU 



PCT 



NOTICE INFORMING THE APPLICANT OF THE 
COMMUNICATION OF THE INTERNATIONAL 
APPLICATION TO THE DESIGNATED OFFICES 

(PCT Rule 47.1(c), first sentence) 



To: 



RAUHE, Hilmar 
Gutenbergstrasse 29 
D-45128 Essen 
ALLEMAGNE 



Date of mailing (day/month/year) 
12 October 2000 (12.10.00) 




Applicant's or agent* s file reference 


IMPORTANT NOTICE 


International application No. 
PCT/EP00/02893 


International filing date (day/month/year) 
31 March 2000 (31.03.00) 


Priority date (day/month/year) 
31 March 1999 (31.03.99) 


Applicant 

RAUHE, Hilmar etai 



1 Notice is hereby given that the International Bureau has communicated, as provided in Article 20, the international application 
to the following designated Offioes on the date indicated above as the date of mailing of this Notice: 

US 

In accordance with Rule 47.1(c), third sentence, those Offices will accept the present Notice as conclusive evidence that 
the communication of the international application has duly taken place on the date of mailing indicated above and no copy 
of the international application is required to be furnished by the applicant to the designated Office(s). 

2. The following designated Offices have waived the requirement for such a communication at this time: 

EP,JP 

The communication wilt be made to those Offices only upon their request. Furthermore, those Offices do not require the 
applicant to furnish a copy of the international application (Rule 49.1 (a-bis)). 

3. Enclosed with this Notice is a copy of the international application as published by the International Bureau on 
12 October 2000 (12.10:00) under No. WO 00/59917 

REMINDER REGARDING CHAPTER II (Article 31{2)(a) and Rule 54.2) 

If the applicant wishes to postpone entry into the national phase until 30 months (or later in some Offices) from the priority 
date, a demand for international preliminary examination must be filed with the competent International Preliminary 
Examining Authority before the expiration of 19 months from the priority date. 

tt is the applicant's sole responsibility to monitor the 19-month time limit. 

Note that only an applicant who is a national or resident of a PCT Contracting State which is bound by Chapter II has the 
right to file a demand for international preliminary examination. 

REMINDER REGARDING ENTRY INTO THE NATIONAL PHASE (Article 22 or 39(1)) 

If the applicant wishes to proceed with the international application in the national phase, he must within 20 months 
or 30 months, or later in some Offices, perform the acts referred to therein before each designated or elected Office. - 

For further important information on the time limits and acts to be performed for entering the national phase, see the 
Annex to Form PCT/IB/301 (Notification of Receipt of Record Copy) and Volume II of the PCT Applicant s Guide. 



The International Bureau of W1PO 
34, chemin des Colombettes 
1211 Geneva 20, Switzerland 



Facsimile No. (41-22) 740.14.3B 



Authorized officer 

J. Zahra 

Telephone No. (41-22) 338.83.38 



Form PCT/IB/308 (July 1996) 



3564787 



• * 



PCT 



9 



~ WELTOR °ANISATION FOR GEJSTIGES EirFNT,™ BtnQimffl 

INTERNATIONALE ANIUPr m tk,^ , '"Rationales Bo* E,GEN ™ TOW 

DIE 

»tionaIe PatenUdasslfikation 7 : 1 r^^LGEBIETDE^ 



(51) Internationale Patentklassifikation 7 . 
C07H 21/00 



A2 



(21) Internationa.es Aktenzeichen: PCT/EP0O/02893 

(22) Internationales AnmeJdedatum: 31. Mar* 2000 (31.03.00) 

(30) Prioritatsdaten: 

199 14 808.2 31. Marz 1999 (31.03.99) DE 

(71) (72) Anmelder uhd Erflnder- RAIthp u i 

Gutenbergstrcsse 29, D^S. UB^pg**" [DE/DI * 

(72) Erfinder; und 

(75) Erflnder/Anmelder fn« r JUr US)- KPinvAx^ 

(DE). BANZHAF, Wolfgang mk/l£? J U ' SbUrg 

S£T 9 Domnund » ss. ssr? 

[GB/DEJ; He.nesrrasse 19, D-50931 K6In (DE) 



(ID Internationale Vero^ntIich U „ gsnuminer: WO 

12. Oktober2000 (12.10.00) 



(43) Internationales 

Veroffentiichungsdatum 



(81) B-gj^g,: g jjs. patem ^ 

NL, PT, SE). ' ' **' GBl GR - m - IT - LU. MC. 

VeroffenUicht 





(57) Zusammenfassung ^ C ' ng 



VERTRAG Q^R DIE INTERNATIONALE ZUSAflflKNARBEIT 
AlFDEM GEBIET DES PATENTWES^fe 



Absender: ANMELDEAMT 



An 



RAUHE, Hilmar 
Gutenbergstrasse 29 
D-45128 Essen 
ALLEMAGNE 



PCT 



MrrrEiLUNG des internationalen 

AKTENZEICHENS UND DES 
INTERNATIONALEN ANMELDEDATUMS 



(Regel 20.5x) PCT) 





Absendedatum j 
(TagfMonatUahr) f ^, UD. IfU 


Aktenzeichen des Anmelders oder An waits 


WICHTIGE MITTEILUNG 


Internationales Aktenzeichen 

PCT/EP 00/ 02893 


Internationales Anmeldedatum( TagiMonaCJahr) 
31/03/2000 


Prioritatsdatumf Tag/MonatUahr) 
31/03/1999 


Anmelder 

RAUHE, Hilmar 


Bezeichnung der Erfindung 



1. Dem Anmelder wird mitgeteilt, dafl der internationalen Anmeldung das oben genannte international Aktenzeichen und Internationale 
Anrneldedatum zuerkannt worden isL 

2. Weiterhin wird dem Anmelder mitgeteilt, daQ das Aktenexamplar der internationalen Anmeldung dem Internationalen Biiro am 
oben angegebenen Absendedatum iibermittelt worden ist. 



X 



Sonstiges: 

Hiermit teilen wir Ihnen mit, dass die Internationale 
Anmeldung 122 Blatter enthalt. 

Deswegen werden Sie gebeten die Zusatzblattgeblihr 
(DM 17,60 x 3 = DM 52,80) innerhalb on einem Monat 
nach dieser Aufforderung zu entrichten. 



* Das Internationale Biiro uberwacht die Uberrniuiung des Aktenexemplars durch das Anmeldeamt und unterrichtet den Anmelder iiber 
dessen Eingang (mit Formblatt PCT/IB/301). Ist das Aktenexemplar bei Ablauf des vierzehnten Monats nach dem Prioritatsdatum 
noch nicht eingegangen, teilt das Internationale Biiro dies dem Anmelder mit (Regel 22.1.C)). 



Name und Postanschrift des Anmeldeamts 



Europaisches Paten tarn t, P.B. 5818 Patentlaan 2 
/till NL-22S0 HV Rijswijk 

SD/I Tel. ( -31-70)340-2040, Tx. 31 651 epo nl, 
. Fax: ( - 31-70) 340-3016 



Bevollmiichtigter Bediet*leier 

f 



Formblatt PCT/RO/105 (0792) P20404 



PCT 



ANTRAG 



Der Unterzeichnete beantragt. dafi die vorliegende 
Internationale Anmeidung nach dem Venrag uber die 
international Zusammenarbeit auf dem Gebiet des 
Patentwesens behandelt wird. 



Vom Anmeldeamt auszuflillen 



PCT/EPQ0/-0 2 8 93 

ImernationaJes Aktenzeichen NO. 



31 MAR 2000 

Internationales Anmeldedatum 



(3 1 urn) 



EUROPEAN PATENT OFFICE 
PCT INTERNATIONAL APPLICATION 
Name des Anmeldeamts und "PCT International Application'* 



Aktenzeichen des Anmelders oder Anwalts (fails gewUnscht) 
(max. 12 Zeichen) 



Feld Nr. I BEZEICHNUNG DER ERFINDUNG 

Informationstragende und informationsverarbeitende Polymere 



Feld Nr. II ANMELDER 



J?^rltt? ft ri tfwilienname. Vprname; bei juristischen Personen vollstandige amtliche Bezeichnung. 
Bet der Ansclmft sind die Posteitzahl und der Name des Staats anzugeben, , Der in diesem Feld in der 

Staat des Sttzes oder Vtohnsitzes angegeben ist.) 

Rauhe, Hilmar 
Gutenbergstr. 29 
45128 Essen 
Deutschland 



Staatsangehoriskeit (Staat): 
DE 



njfl Diese Person ist 
*— 1 gleichzeitig Erfinder 



Tele f on nr.: 

+49 201 2480912 



Telefax nr.: 

+49 40 3603 211254 



Femschreibnr.: 



Sitz oder Wohnsitz (Staat): 
DE 



Diese Person ist Anmelder 
fiir folgende Staaten: 



j/| alle flestim- 
zU mungsstaaten 



□ aJJe Bestimmungssiaaten mit Ausnahme 
der Vereinigien Staaien von Amerika 



□ nur die Vereinigten [— ] die im Zusatzfeld 
Stamen von Amerika \ j angegebenen Staaten 



Feld Nr. Ill WEITERE ANMELDER UND/ODER (WEITERE) ERFINDER 



fiffi^W^ n 0rn T e y Hi) urist J sc K en Personen ^llstdndige amtliche Bezeichnung. 

A jJu -« hn f\ s,n V 1ie ^stUitzahl und der Name des Staats anzugeben. Der in diesem Feld in der 

Feldkamp, Udo 
Neudorfer Str. 141 
47057 Duisburg 
Deutschland 



Diese Person ist: 
| | nur Anmelder 

|Xl Anmelder und Erfinder 

□ 



nur Erfinder (Wird dieses Kastchen 
angekreuv, so sind die nachstehenden 
Angaben nicht notig.) 



^matsangehorigkeit (Staat): 



Diese Person ist Anmelder 
fUr folgende Staaten: 



Sitz oder Wohnsitz (Staat): 
DE 



| j alle Bestim- 



mungsstaaten 



□ aJle Bestimmungsstaaten mit Ausnahme 
der Vereinigten Staaten von Amerika 



I I Weitere Anmelder und/oder (weitere) Erfinder sind auf 



nur die Vereinigten 



Siaaten von Amerika 



□ die im Zusatzfeld 
anf 



angegebenen Staaten 



einem Fortsetzungsblatt angegeben. 



FeldNr. IV ANWALT ODER GEMEINSAMER VERTRETER; ODER ZUSTELL ANS CHRIFT 



Die folgende Person wird hiermit bestellt/ist bestellt worden, urn fur den (die) Anmelder I 1 A 

vor den zustandigen mtemationalen Behorden in folgender Eigenschaft zu handeln als: I I AnwaIt 



□ gemeinsamer 
Vc 



/ertreter 



Name und Anschrift: (Familienname Vorname; bet juristischen Personen voiistdndige amtliche 
Bezeichnung. Bet der Anschrift sind die Postleitzahl und der Name des Staats 
anzugeben.) 



Telefonnr.: 



Telefax nr.: 



Fernschreibnr.: 



□ ?hiti e i l ^M hl;ift: Die ? e n K ^ stch f" isl anzukreuzen, wenn kein Anwalt oder gemeinsamer Venreter bestellt j 
obigen Feld eine spezielle Zustellanschrift angegeben ist. ^icm j 



stem ist und statt dessen inr 



c 



Formblatt PCT/RO/I01 (Blatt I> (Juli 1998; Nachdruck Januar 2000) 



Siehe Anmerkungen zu diesem Antragsformular 



Blatt Nr. 



Fortsetzung von Feld Nr. Ill WEITERE ANMELDER UND/ODER (WEITE RE) ERFINDER 

Wird keines derfolgenden Felder benutzt, so soilte dieses Blatt dem Antrag nicht beigefugt werden. 



Anschrift angegebene Staat SRIt ^li^r wJi^ QI \^oen 0 er m diesem Feld in der 
Statu dts Sines Oder wXsi^ ° deT Wohnsit ™ Anmelders, safern nachstehend kein 

j Banzhaf, Wolfgang 
Siegenstr. 104 
44359 Dortmund 
Deutschland 



^taatsangehorigkeit (Staat): 



Diese Person ist Anmelder 
f(ir folgcnde Staaten: 



| | alleBestim- 



Diese Person ist: 
[_ j nur Anmelder 

Anmelder und Erfmder 

I I nur Erfinder I Wird dieses Kastchen 

1 ' angekreuzt, so sind die nachstehenden j 

Angaben nicht notig.) 



Sita oder Wohnsitz (Staat): 



[ mungsstaaten 



□ alle Bestimmungsstaaien mil Ausnahme fCTI 
der Veremigten Staaten von Amerika I A | 



nur die Vereinigten 
Staaten von Amerika 



Kronen vollstandige amtliche Bezeichnung. 
Anschrift angegebene Staat ht der tout £ t J^Jw?*™** ^ugeben. Def in diesem Feld in d!r 
Staat des Siheloder wZJiS^^^^f Wohnsttzes des Anmelders, sofern nachstehend kein 

(Howard, Jonathan C. 
Heinestr. 19 
50931 Koln 
Deutschland 



j J die im Zusatzfeld 



angegebenen Staaten 



Staatsangehorigkeit (Staat): 
GB 



Diese Person ist Anmelder 
for folgende Staaten: 



□ alle Bestim- 
i 



Diese Person ist: 
I ~| nur Anmelder 

Anmelder und Erfinder 

j I nur Erfinder (Wird dieses Kastchen I 
*— I angekreuzt, so sind die nachstehenden \ 
Angaben nicht notig.) 



I mungsstaaten 



Sitz oder Wohnsitz (Staat): 
DE 

□ alle Bestimmungsstaaien mit Ausnahme njTI nlirdie Vereinigten 
^ V *'™igten Staaten von Amerika 1X1 Staaien vonXenka 



^ft^/fcAe Bezeichnung, 

Anschrift angegebene Staat ist anzugeben. Der in diesem Feld in der 
Staat des Sitzes ode, ^ W^il^/mg^iS SlT Wohnstne * des *"wM«* sofern nachstehend kein 



□ die im Zusatzfeld 
angegebenen Staaten 



Staatsangehorigkeit (Staat): 



Diese Person ist Anmelder 
fur folgende Staaten: 



□ alle Beslim- 
i 



Diese Person ist: 
1 [ nur Anmelder 

L j Anmelder und Erfinder 

I I nur Erfinder (Wird dieses Kastchen] 

1 1 angekreuzt, so sind die nachstehenden \ 

Angaben nicht notig.) 



Sitz oder Wohnsitz (Staat): 



I mungsstaoten 



□ alle Bestimmungsstaaien mit Ausnahme 
der Vereinigten Staaten von Amerika 



□ nur die Vereinigten 
Staaten von Amerika 



Statu des Situs oder WohiJines anfegXnh!.] Wohns " :es d " Welders, sofern nachstehend kein 



□ die im Zusatzfeld 
angegebenen Staaten 



Staatsangehorigkeit (Staat): 



Diese Person ist: 
1 ~| nur Anmelder 

□ 



□ 



Anmelder und Erfinder 

nur Erfinder (Wird dieses Kastchen | 
angekreuzt, so sind die nachstehenden 
Angaben nicht notig.) 



Sitz oder Wohnsitz (Staat): 



Diese Person ist Anmelder j— | n a ■ , ' " ~~ — 

mr fo, g enUe S,aa,e„: □ *fe U^^T^^^ □ M£3S&. □ 



die im Zusatzfeld 
angegebenen Staaten 



□ Weitcre Anmelder und/oder (weitere) Erfinder sind auf e i n e m zustalichen Fortsetzungsblatt angegeben 

^ 7 ; 1 

M ' ™ cnaruc K Januar2000) Siehe Anmerkungtn zu diesem Antragsformular 



Blatt Nr. 3 



PCT/EPOO/ 0 2 8.9.3 




vorgcnommen (bitte die emsprechenden Kastchen ankreuzen: *e rugs tens ein Kdstchen 



mufi 



angekreuzt werden): 
Regionales Patent 

AP Efl^K^^^ ? D \^ S << Sierra Leone. 

Harare-Protokolls und des PCT ist Uganda, ZW Simbabwe und jeder wcicere Staat, dcr Vertragsstaat des 

KZ Kasachstan. MD Republik 

Patentubereinkommens und des p ^ J is { aascn,K,stan ' *M Turkmenistan undjederweuere Staat, der Venragsstaatdes Eurasischen 
Europaisches Patent: AT Osterreich, BE Bel 



□ 



EA 



EP 



□ OA 



IE E Iri, C nTT h W C^V^ ^ Llechienstcin. CY Zypern. 

oer venragsstaatdes Europaischen Patentubereinkommens und des PCT isi ™ rtu S al - SE Schweden und jeder weitere Staat, 



hwrf. fan; <«</</«• #e/)l m* ( « CT o^taij ' _ _ 151 ^"neandereSchmzrechlsanodereinsonstigez Verfahren gewiinschl 



□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 

□ 
□ 
□ 

□ 
□ 
□ 
□ 



Emirate 

AL Albanien 

AM Armenien 

AT Osterreich 

AU Australien 

AZ Aserbaidschan 
BA Bosnien-Herzegowinu 
BB Barbados 

BG Bulgarien 

BR Brasiiien 

BY Belarus ".'.7. 

CA Kanada 

CH und LI Schwciz und Liechtenstein 

CN China 

Costa Rica 

Kuba 



CR 
CU 
CZ 
DE 
DK 
DM 
EE 
ES 
FI 
GB 
GD 
GE 
GH 
GM 
HR 
HU 
ID 
IL 
IN 
IS 
JP 
KE 
KG 
KP 



□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 

□ 
□ 
□ 
□ 
□ 

Tschechischc Republik 5 

Deutschland 

□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 
□ 

EI 



Danemark 
Dominica 
Estland . . 
Spanien . . 
Finnland . . 
Vereinigtes 
Grenada 
Georgien . . 
Ghana . . . . 
Gambia 
Kroatien . . 
Ungarn . , . 
Indonesien 

Israel 

Indien .... 
Island 

Japan .... 
Kenia .... 
Kirgisistan 



Konigreich 



angeben): 

LR Liberia 

LS Lesotho 

LT Litauen 
LU Luxemburg 
LV Leal and 

MA Marokko 

MD Republik Moldau 

MG Madagaskar 

MK Die ehemalige jugoslawische Republik 

Mazedonien 

MN Mongolei 

MW Malawi 

MX Mexiko 

NO Norwegen 

NZ Neuseeland 

PL Polen 

PT Portugal 

RO Rumanien 

RU Russische Foderation 

SD Sudan 
SE Schweden 
SG Singapur 

SI Slowenien 

SK Slowakei 

SL Sierra Leone 

TJ Tadschikistan 

TM Turkmenistan 

TR Turkei 7777 

TT Trinidad und Tobago 

TZ Vereinigte Republik Tansania 

UA Ukraine 

UG Uganda 

US Vereinigte Staaten von Amerika 



□ 
□ 
□ 



Demokratische Volksrepublik Korea □ 



UZ 
VN 
YU 
ZA 



Usbckistan 
Vietnam . . . 
Jugoslawien 
Siidafrika 



KR 
KZ 
LC 
LK 



Republik Korea 



□ ZW Simbabwe 



Kasachstan ... w cn .■"[ die B _5 stirTimun g v °n Staaten , die dem PCT nach der 

Saint Lucia Veroffentlichung dieses Formblatts beigetreten sind: 

Sri Lanka 



□ 
□ 



Bestatigu e ng --- afUng ?H s ?=nommen sind r>« % „ ™l!il?5 n Y°I ™ l Ausnahme der im Zusatzfeld genannten Bestimmun^n Hi- 



-rKianing ausgenommen sind. Der Anmelder erkifrTrf'-Tri 'a'£Z"?.\'££k u" "£ *-f salzre,a genannten Bestimmungcn. die 
, aw rr - Sl ^ n T djede 2"satzliche Bestimmung dU ?w Abla^f vonl i^i.n , k^" B " ,lmmun S«> "iter dem Vorbehalt einer 
Ablauf dieser Fnst ais vom Anmelder zuruckgenomrnen (Die ' B^fa^o fT ai } f. e ^" 0 P t ^ d l t T nicht bes,ati B t wurd e, nach 
| mnerhalb der Frist von 15 Monaten eingehen.) mmen gIU - (u,e s estaiigung (emschhefiheh der Gebuhren) mufi bean Anmeldeamt 

Formblatt PCT/RO/10I (Blatt 2) (Januar 2000) " — ' ~ — 

Stehe Anmerkungen zu diesem Antragsformular 



Feld Nr. VI PRIORITATSANsWuCH 



BlattNr. f\ . 



Anmcidedatum 
der friiheren Anmeldung 
(Tag/Monat/Jahr) 



Zcilc (1) 



Zeile (2) 



'(31/03/99)* 

A 3 1 MAR 1999 



Aktenzeichen 
der friiheren Anmeldung 



19914808.2 



rut/cr u u / u z ij a j 



□ Weitere PrioriiSSanspruche sind tm Zusatzfeid angegeben. 



nationale Anmeldung: 
Staat 



1st die fruhere Anmeldung eine: 



regionale Anmeldung:* 
regionales Amt 



intemationale Anmeldung 
Anmeldeamt 



I— I bSJ^S^^h^SS^^ Cin / e ^g Iaubi 8 te Abschrift der oben in der (den) Zcile(n) __ 



Feld Nr. VII INTERNATIONALE RECHERCHENBEHORnF." 



„ ■-. internationalen RecherchenbchSrde (ISA) 
(falls zwti nder mehr ah zwei international* Rtchtrchtn- 
.u«^",P f,>r i" '""rnatumalen Reentrant 

MtOndlgsind. gehen Siedie von Ihnen gewdhlte Bthiirdt an; 
derZweihuchstahen-Cade kann benutzt werden): 

ISA/ 



OW^^kLi^^,,^ E ??* niss ; fniheren Recherche; Bezugnahme auf dlese 



Datum (Tag/Monat/Jahr) Aktenzeichen 



Staat (oder regionales Amt) 



Feld Nr. Vin KONTROLLISTE; EINREICHtJNflSSPR A rm? 



Diese internationale Anmeldung enthalt 
die foigende Anzahl von Blatterm 
Antrag ;4 

Beschreibung (ohne 
Sequenzprotokollteil) rgej 71* 

Anspriiche :5 

Zusammenfassung :-j 

Zeichnungen :-jg 

Sequenzprotokollteil 
der Beschreibung :21 



Blattzahl insgesamt :fe%i'<ZZ* 



Abbildung der Zeichnungen, die 
mit der Zusammenfassung 
veroffentlicht werden soil (Nr.): 



Dieser internationalen Anmeldung liegen die nachstehend angekreuzten Unterlagen bei: 

1. Q Blatt fur die Gebuhrenberechnung 

2. □ Gesonderte unterzeichnete Vollmacht 

3. Q Kopie der allgemeinen Vollmacht; Aktenzeichen (falls vorhanden): 

4. [7J Begriindung fur das Fehlen einer Unterschrift 

5. □ Prioritatsbeleg(e), in Feld Nr. VI durch 

foigende Zeilennummer gekennzeichnet: 

6. □ Ubersetzung der internationalen Anmeldung in die foigende Sprache: 

7. □ Gesonderte Angaben zu hinterlegten Mikroorganismen oder anderem biologischen Material 

8. □ Protokoil der Nucleotid- und/oder Aminosauresequenzcn in computerlesbarer Form 

9. □ Sonstige (einzeln auffiihren): 



Sprache, in der die 
Internationale Anmeldung DE 
eineeteicht wird: 



Feld Nr. IX UNTERSCHRIFT PES ANMELDERS ODER DES ANWALTS 



Der Name jedi 
aus dem Antn 

Rauhe, Hilmar 



H.lmar < ^ "^buC^ 

Feldkamp, Udo 



Banzhaf, Wolfgang 
Howard, Jonathan C. 



"1 C . ffr>u?<j^) 



I. Datum des tatsachlichen Eingangs dieser 
internationalen Anmeldung; 



3. Geandertes Eingangsdatum aufgnmd nachtragiich. jedoch 
fnstEerecht emgegangener Unterlagen oder Zeichnungen 
zur Vervollstandigung dieser internationalen Anmeldung' 



■ Vom Anmeldeamt auszurullen _____ 

3 t m 2000 (3 1. 01 00) 



Datum des fristgerechten Eingangs der ang< 
Rjchtigsteilungen nach Artikei 11(2) PCT: 



;eforderten 



□ 



Zeichnungen 
einge- 
gangen: 

nicht ein- 
gegangen: 



5. Internationale Recherchen be horde 

(fails zwei oder mehr zustandig sind): ISA / 



6 * I I Ubermittlung des Recherchenexemplars bis zur 
1 1 ^anlung der Recherchengebuhr aufgeschoben 



Datum des Eingangs des Aktenexemplars 
beim Internationalen BUro: 



►Vom Internationalen Btiro auszufullen 



Formblatt PCT/RO/101 (letztes Blatt) (Jul: 1998; Nachdruck Januar 2000) 



Siehe Anmerkungen zu diesem Antragsformular 



-"2 




PATENT COOPERATION TRE 

PCT 



^V^ INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



(PCT Article 36 and Rule 70) 



Applicant's or agent's file reference 


SeeNotificationofTransmittalofinternational Preliminarv 
FOR FURTHER ACTION Examination Report (Forrn PCT/IPEA/4I6) 


International application No. 


International filing date {day/month/year) 


Priority date (day/month/year) 


PCT/EP00/02893 


31 March 2000 (31.03.00) 


31 March 1999 (31.03.99) 


International Patent Classification (IPC) or national classification and IPC 




G06N 3/00, 3/12 






Applicant 


RAUHE, Hilmar 





1 . This international preliminary examination report has been prepared by this International Preliminary Examining Authority 
and is transmitted to the applicant according to Article 36. 



This REPORT consists of a total of 



. sheets, including this cover sheet. 



This report is also accompanied by ANNEXES, i.e., sheets of the description, claims and/or drawings which have been 
amended and are the basis for this report and/or sheets containing rectifications made before this Authority (see Rule 
70.16 and Section 607 of the Administrative Instructions under the PCT). 



These annexes consist of a total of _ 



sheets. 



3. This report contains indications relating to the following items: 
I fx] Basis of the report 
Priority 

Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 
Lack of unity of invention 

Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 

Certain documents cited 

Certain defects in the international application 
Certain observations on the international application 
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□ 


III 


□ 


IV 


□ 


V 




VI 


□ 


VII 




VIII 


X 



Date of submission of the demand 

26 October 2000 (26.10.00) 


Date of completion of this report 

15 May 2001 (15.05.2001) 


Name and mailing address of the IPEA/EP 
Facsimile No. 


Authorized officer 
Telephone No. 



Form PCT/IPEA/409 (cover sheet) (July 1998) 



flBVARY EXAMINATION REPORT MW 



national application No. 

INTERNATIONAL PREflBNARY EXAMINATION REPORT PCT/EP00/02893 



I. Basis of the report 



I . With regard to the elements of the international application:* 
| | the international application as originally filed 
|^| the description: 

pages 1_^7J , as originally filed 

pages , filed with the demand 
pa^es , filed with the letter of 

^ the claims: 

pages , as originally filed 

p a g es , as amended (together with any statement under Article 19 

pages , filed with the demand 

pages N22 , filed with the letter of 18 April 2001 (18.04.2001) 



^ the drawings: 

pages 1-37 , as originally filed 

pages 



, filed with the demand 



pages , filed with the letter of 

| | the sequence listing part of the description: 

pages ^ , as originally filed 

pages * fil ec * w * tn tne demand 

pages N44 , filed with the letter of 09 July 2000 (09.07.2000) 

2. With regard to the language, all the elements marked above were available or furnished to this Authority in the language in which 
the international application was filed, unless otherwise indicated under this item. 

These elements were available or furnished to this Authority in the following language which is: 

1 1 the language of a translation furnished for the purposes of international search (under Rule 23.1(b)). 
| | the language of publication of the international application (under Rule 48.3(b)). 

| | the language of the translation furnished for the purposes of international preliminary examination (under Rule 55.2 and/ 
or 55.3). 

3. With regard to any nucleotide and/or amino acid sequence disclosed in the international application, the international 
preliminary examination was carried out on the basis of the sequence listing: 

1 | contained in the international application in written form. 

| | filed together with the international application in computer readable form. 

furnished subsequently to this Authority in written form. 

1 1 furnished subsequently to this Authority in computer readable form. 

[X] The statement that the subsequently furnished written sequence listing does not go beyond the disclosure in the 

international application as filed has been furnished. 
^ The statement that the information recorded in computer readable form is identical to the written sequence listing has 

been furnished. 

4 I 1 The amendments have resulted in-the cancellation of: 

I I the description, pages 

1 1 the claims, Nos. 



1 1 the drawings, sheets/fig 

1 1 This report has been established as if (some of) the amendments had not been made, since they have been considered to go 
■ — ' beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)).** 

* Replacement sheets which have been furnished to the receiving Office in response to an invitation under Article 14 are referred to 
in this report as "originally filed" and are not annexed to this report since they do not contain amendments (Rule 70. J 6 
and 70.17). 

** Any replacement sheet containing such amendments must be referred to under item J and annexed to this report. 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 

Novelty (N) 

Inventive step (IS) 
Industrial applicability (IA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



1-17 



18-22 



1-17 



18-22 



1-22 



YES 
NO 
YES 
NO 

YES 
NO 



Citations and explanations 
1. 



The report makes reference to the following 
documents. Dl is discussed in the description (page 
3) . 



Dl : Erik Winfree et al., "Universal Computation via 
Self-assembly of DNA: Some Theory and 
Experiments" , Proceedings of the 2 nd DIMACS 
Meeting on DNA Based Computers, Princeton 
University, June 20-21 1996 

D2: WO-A-97/24699 (S E AXIS LIMITED) 10 July 1997 
(1997-07-10) 

D3: US-A-5 139 812 (LEBACQ PHILIPPE) 18 August 1992 
(1992-08-18) . 



2. The subject matter of Claim 1 relates to a method 
for producing information-carrying polymers. The 
closest prior art is Dl, which discloses the steps 
I, IV and V of the claimed method (cf . Dl, section 
2.3, pp. 7-8 "Linear Self Assembly is equivalent to 
Regular Languages'' and the example in Fig. 3). Dl 
does not disclose the use of the Niehaus-Feldkamp- 
Rauhe (NFR) method for producing the required 
monomer sequences (steps II and II of the claimed 
method) . 



Form PCT/IPEA/409 (Box V) (January 1994) 



INTERNATIONAL PREI^HNARY EXAMINATION REPORT 



International application No. 
/EP 00/02893 



ft 



The invention addresses the problem of implementing 
the concept disclosed in Dl in as robust and 
efficient a manner as possible. This problem is 
solved by a method as per Claim 1, in particular by 
using the NFR method for generating monomer 
sequences with desired properties (cf. description, 
page 14) . A solution such as this cannot be derived 
from the prior art. Claim 1 is therefore deemed to 
be novel and to involve an inventive step (PCT 
Article 33(2) and (3)). 



3 Dependent Claims 2 to 17 contain further embodiment 

details of the method. Since they are dependent on 
Claim 1, they also meet the requirements of PCT 
Article 33(2) and (3) with respect to novelty and 
inventive step. 

4. Preliminary comments with respect to Claim 18: 

A patent claim in which a product is characterised 
by a method of manufacture must be considered to be 
concerned with the product as such. Even the wording 
"product A obtained by method B" must be interpreted 
to mean "product A obtainable by method B" . 

In addition, the specific wording "in particular of 
polymers obtained according to one of Claims 1-5" 
designates a purely optional feature which can be 
omitted . 



4.1 The subject matter of Claim 18 is anticipated by: 
a) the "natural" encryption of biological 

information in DNA (e.g. directly by the genetic 
code, or - if "known" keys are to be excluded - 
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also further-reaching, in part still unknown 
biological information, such as for example 
" leads to the malformation of an organ" f etc.) 

b) D2, page 6, lines 15-23, page 7, line 15 and 
lines 22-25 ("encrypted representation"), and 
pages 16-19, 

c) D3, column 9, lines 4-27 and lines 36-38 ("any 
numeric code, signature or other recognisable 
symbol" ) , col. 4, lines 30-33 and line 62 - col. 
5, line 2. 

5 The subject matter of Claim 19 is anticipated by: 

a) the genetic code (see above) , wherein a plurality 
of DNA segments - at least according to current 
understanding - carries no biologically 
effective information (genes) 

b) D2 and D3 : it is implicitly clear that the marked 
places are contaminated by "natural" DNA during 
normal use and also that this factor will 
complicate the unauthorised locating of the 
hidden and unknown DNA sequences; cf. e.g. D3, 
column 9, lines 20-27. (This contamination is 
considered to be implicitly disclosed. If this 

is disputed, a lack of inventive step would 
nevertheless still be registered, since such a 
contamination would be expected.) 

6 Claim 20: see : Claim 18. 

7 Claim 21: implicit in D2 and D3 (the use of a primer 
is usual in standard methods for hybridising 
complementary nucleic acid sequences) . 

8 Claim 22: see Claim 18: D2 and D3 disclose the 
intended use. 
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VII. Certain defects in the international application 



The following defects in the form or contents of the international application have been noted: 



See supplemental sheet, 
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VIII. Certain observations on the international application 



The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

See supplemental sheet . 
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Supplemental Box 




(To be used when the space in any of the preceding boxes is not sufficient) 




Continuation of: VII & VIII 



9 Essential features are missing from Claims 18-22. 

The claims take the form "use of X for Y" . In the 
present cases, this wording amounts merely to a 
definition of the problem to be solved, wherein not 
all of the features essential to implementing the 
solution are indicated (cf. PCT Examination 
Guidelines, Chapter III-3.4 and 4.4). Thus, for 
example, it is not clear from the wording of the 
claims how the polymers become "information- 
carrying" . 



The set of claims as a whole lacks clarity, since 
the large number of independent claims (with an 
only partially overlapping scope of protection) 
makes it hard, if not impossible, to identify the 
subject matter for which protection is sought, and 
it is therefore unreasonably difficult for third 
parties to determine the scope of protection. 



The claims do not have reference signs in 
parentheses indicating the corresponding symbols in 
the appended figures. The parenthesising of other 
expressions in the claims makes the intended scope 
of protection unclear. Thus, for example, the 
essential term x> Niehaus-Feldkamp-Rauhe method" is 
only referred to in parentheses (and thus without 
restricting effect), whilst in the actual text of 
the claims only abbreviations are used . 



12 Although the relevant prior art disclosed in 
document Dl is discussed in the description, 
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Continuation of: VII & VIII 



neither the description nor the claim makes it 
unambiguously explicit that Dl already discloses 
steps I, IV and V of the method according to Claim 



1 . 
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Note: 



The meaning of the terms used must be clear from 
the claims themselves. The term « Niehaus-Feldkamp- 
Rauhe method" is not generally known and should 
therefore have been defined in the claims. However, 
since the inclusion of the full-length, detailed, 
step-by-step description of the method (cf. p. 14) 
would drastically impair the readability of the 
claims, it would appear in this particular case 
that an indirect reference such as this to the 
description would, exceptionally, be appropriate 
(cf. PCT Examination Guidelines, Chapter III-4.10 
and PCT Rule 6. 2 (a) ) . 
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■ WiPO __ PC _ T 
INTERNATIONALER VORLAUFIGER PRUFUNGSBERICHT 

(Artikel 36 und Regel 70 PCT) 



Aktenzeichen des Anmelders oder Anwalts 


siehe Mitteilung uberdie Ubersendung des internationalen 
WEITERES VORGEHEN vorlaufigen Prufungsberichts (Formblatt PCT/IPEA/416) 


Internationales Aktenzeichen 
PCT/EP00/02893 


Internationales AnmeldedatumfTa^/WonafcOa/?^ 
31/03/2000 


Prioritatsdatum (T ag/Monat/T ag) 
31/03/1999 



Internationale Patentklassifikation (IPK) Oder nationale Klassifikation und IPK 
G06N3/12 



Anmelder 

RAUHE, HILMAR et at. 



1. Dieser internationale vorlaufige Prufungsbericht wurde von der mit der internationalen vorlaufigen Prufung beauftragten 
Behorde erstellt und wird dem Anmelder gemaB Artikel 36 ubermittelt. 



2. Dieser BERICHT umfaBt insgesamt 7 Blatter einschlieBlich dieses Deckblatts. 

IS Aufierdem liegen dem Bericht ANLAGEN bei; dabei handelt es sich um Blatter mit Beschreibungen, Anspruchen 
und/oder Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser 
Behorde vorgenommenen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Verwaltungsrichtlinien zum PCT). 

Diese Anlagen umfassen insgesamt 5 Blatter. 



3. Dieser Bericht enthalt Angaben zu folgenden Punkten: 



II 


□ 


III 


□ 


IV 


□ 


V 




VI 


□ 


VII 




VIII 


SI 



Grundlage des Berichts 
Prioritat 

Keine Erstellung eines Gutachtens uber Neuheit, erfinderische Tatigkeit und gewerbliche Anwendbarkeit 
Mangelnde Einheitlichkeit der Erfindung 

Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 

Bestimmte angefuhrte Unterlagen 

Bestimmte Mangel der internationalen Anmeldung 

Bestimmte Bemerkungen zur internationalen Anmeldung 



Datum der Einreichung des Antrags 



26/1 0/2000 



Datum der Fertigstellung dieses Berichts 



1 5. 05. 01 



Name und Postanschrift der mit der internationalen vorlaufigen 
Prufung beauftragten Behorde: 
Europaisches Patentamt 

D-80298 Munchen 
Tel. +49 89 2399 - 0 Tx: 523656 epmu d 

Fax: +49 89 2399 - 4465 



Bevollmachtigter Bediensteter 
Borotschnig, H 

Tel. Nr. +49 89 2399 7459 
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# 



INTERNATIONALER VORLAUFIGER 
PRUFUNGSBERICHT 



Internationales Aktenzeichen PCT/E POO/02893 



Grundlage des Berichts 

Hinsichtlich der Bestandteile der internationalen Anmeldung (Ersatzblatter, die dem Anmeldeamt auf eine 
ZoLung nach Artlkel 14 h in vorgelegt wurden, gelten im Rabmen 

eingereicht" and sind ihm nicht beigefugt, weil sie keine Anderungen enthalten (Regeln 70. 16 und 70. 1 7)), 
Beschreibung, Seiten: 



1-71 



ursprungliche Fassung 



Patentanspruche, Nr.: 

1 _22 mit Telefax vom 



18/04/2001 



Zeichnungen, Nr.: 
1-37 



ursprungliche Fassung 



Sequenzprotokoll in der Beschreibung, Seiten: 

1-44, eingereicht mit Schreiben vom 09.07.2000. 

2 Hinsichtlich der Sprache: Alle vorstehend genannten Bestandteile standen der Behorde in der Sprache in der 
"£ Rationale Anmeldung eingereicht worden tart, zur Verfugung oder wurden ,n d.eser emgere.cht, sofern 
unter diesem Punkt nichts anderes angegeben ist. 

Die Bestandteile standen der Behorde in der Sprache: zur Verfugung bzw. wurden in dieser Sprache 
eingereicht; dabei handelt es sich um 

□ die Sprache der Obersetzung, die fur die Zwecke der internationalen Recherche eingereicht worden ist (nach 
Regel 23.1(b)). 

□ die Veroffentlichungssprache der internationalen Anmeldung (nach Regel 48.3(b)). 

□ die Sprache der Obersetzung, die fur die Zwecke der internationalen vorlaufigen Prufung eingereicht worden 
ist (nach Regel 55.2 und/oder 55.3). 

3 Hinsichtlich der in der internationalen Anmeldung offenbarten Nucleotid- und/oder Aminosauresequenz ist die 
' Internationale vorlaufige Prufung auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das. 

□ in der internationalen Anmeldung in schriftlicher Form enthalten ist. 

□ zusammen mit der internationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 
IS bei der Behorde nachtraglich in schriftlicher Form eingereicht worden ist. 

□ bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 

H Die Erklarung, da(3 das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht iiber den 

Offenbarungsgehalt der internationalen Anmeldung im Anmeldezeitpunkt h.nausgeht, wurde vorgelegt. 

B Die Erklarung, daB die in computerlesbarer Form erfassten Informationen dem schriftlichen 
Sequenzprotokoll entsprechen, wurde vorgelegt. 
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4. Aufgrund der Anderungen sind folgende Unterlagen fortgefallen: 

□ Beschreibung, Seiten: 

□ Anspruche, Nr.: 

□ Zeichnungen, Blatt: 

«; n Dieser Bericht ist ohne Beriicksichtigung (von einigen) der Anderungen erstellt worden da diese aus den 
angegebenen , Grunden nach Auffassung der Behorde uber den Offenbarungsgehalt ,n der ursprungl.ch 
eingereichten Fassung hinausgehen (Regel 70.2(c)). . 

(Auf Ersatzblatter, die solche Anderungen enthalten, ist unter Punkt 1 hinzuweisemsie sind diesem Bericht 

beizufugen). 

6. Etwaige zusatzliche Bemerkungen: 



V Begriindete Festste.lung nach Artikel 35(2) hinsicht.ich der Neuheit, der erfin derischen Tatigkeit und der 
ge2erblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung d.eser Feststellung 



1. Feststellung 
Neuheit (N) 

Erfinderische Tatigkeit (ET) 
Gewerbliche Anwendbarkeit (GA) 



Ja: Anspruche 1-17 

Nein: Anspruche 18-22 

Ja: Anspruche 1-17 

Nein: Anspruche 18-22 

Ja: Anspruche 1 -22 
Nein: Anspruche 



2. Unterlagen und Erklarungen 
siehe Beiblatt 

VII. Bestimmte Mangel der internationalen Anmeldung 

Es wurde festgestellt, da(B die internationale Anmeldung nach Form oder Inhalt folgende Mangel aufweist: 
.siehe Beiblatt 



VIII. Bestimmte Bemerkungen zur internationalen Anmeldung 

Zur Klarheit der Patentanspruche, der Beschreibung und der Zeichnungen oder zu der Frage, ob die Anspruche 
in vollem Umfang durch die Beschreibung gestutzt werden, ist folgendes zu bemerken: 
siehe Beiblatt 
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Zu Punkt V 

Rg qriindete F^tstelluna na ^h Artikel 35(2) hinsichtlich der Neuheit, der 
grfinderischen Tatigkeit und der aewerblichen Anwen dharkeit; Unterlaqen und 
Erklarunqen zur Stutzuna dies er Feststellunq 

1 Es wird auf die folgenden Dokumente Bezug genommen. D1 wird in der 
Beschreibung diskutiert (Seite 3). 

D1 : Erik Winfree et al., "Universal Computation via Self-assembly of DNA: Some 
Theory and Experiments", Proceedings of the 2nd DIMACS Meeting on DNA 
Based Computers, Princeton University, June 20-21 1996. 
D2: WO 97 24699 A (S E AXIS LIMITED) 10. Juli 1997 (1997-07-10) 
D3: US-A-5 139 812 (LEBACQ PHILIPPE) 18. August 1992 (1992-08-18) 

2. Der Gegenstand von Anspruch 1 betrifft ein Verfahren zur Herstellung 

informationstragender Polymere. Der nachstliegende Stand derTechnik ist D1, 
welches die Schritte I.IV und V des beanspruchten Verfahrens offenbart (vgl. D1 , 
Abschnitt 2.3 pp. 7-8 "Linear Self Assembly is equivalent to Regular Languages" 
und das Beispiel in Fig. 3). D1 offenbart nicht den Einsatz des Niehaus-Feldkamp- 
Rauhe (NFR-)Verfahrens zur Herstellung der benotigten Monomersequenzen 
(Schritte II und III des beanspruchten Verfahrens). 

Der Erfindung liegt die Aufgabe zugrunde das in D1 offenbarte Konzept moglichst 
robust und effizient zu implementieren. Gelost wird diese Aufgabe durch ein 
Verfahren, gemaB Anspruch 1, insbesondere durch Verwendung des NFR 
Verfahrens zur Erstellung von Monomersequenzen mit gewunschten 
Eigenschaften (vgl. Beschreibung, Seite 14). Eine solche Losung ist dem Stand 
der Technik nicht zu entnehmen. Anspruch 1 ist daher als neu und auf 
erfinderischer Tatigkeit beruhend anzusehen, Artikel 33 (2), (3) PCT. 

3 Die abhangigen Anspruche 2 bis 1 7 enthalten weitere Ausgestaltungsmerkmale 
des Verfahrens. Da sie vom Anspruch 1 abhangig sind, erfullen auch sie die 
Erfordernisse des Artikels 33 (2) und (3) PCT bezuglich Neuheit und 
erfinderischer Tatigkeit. 
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4. Vorbemerkungen zu Anspruch 18: 

Ein Patentanspruch, in dem ein Erzeugnis durch ein Herstellungsverfahren 
gekennzeichnet wird, muB als auf das Erzeugnis als solches gerichtet angesehen 
werden Selbst die Formulierung "Erzeugnis A erhalten durch Verfahren B" muss 
im Sinne von "Erzeugnis A erhaltlich durch Verfahren B" interpreter! werden. 

Daruber hinaus bezeichnet die konkret verwendete Formulierung "insbesondere 
von Polymeren, die nach einem der Anspriiche 1-5 erhalten wurden" ein rein 
optionales Merkmal, das weggelassen werden kann. 

4.1 Der Gegenstand von Anspruch 1 8 wird vorweggenommen durch: 

a) die "naturliche" Verschiusselung biologischer Information in DNA (z.B. direkt 
durch den genetischen Code, Oder - falls "bekannte" Schlussel 
ausgenommen werden sollten - auch weitergehende, z.T. noch unbekannte 
biologische Informationen, wie z.B. "fuhrt zur Fehlbildung eines Organs" etc.) 

b) D2 Seite 6 Zeilen 1 5-23, Seite 7 Zeile 1 5 und Zeilen 22-25 ("encrypted 
representation"), und Seiten 16-19 

c) D3 Spalte 9 Zeilen 4-27 und Zeilen 36-38 ("any numeric code, signature or 
other recognizable symbol"), Sp. 4 Zeilen 30-33 und Zeile 62-Sp. 5, Zeile 2. 

5 Der Gegenstand von Anspruch 1 9 wird vorweggenommen von: 

a) dem genetischen Code (siehe oben), wobei eine Vielzahl von DNA 
Abschnitten - zumindest nach gegenwartigem Verstandnis - keine biologisch 
wirksame Information (Gene) tragt. 

b) D2 und D3: implizit ist klar, daB die markierten Stellen bei normalem 
Gebrauch durch "naturliche" DNA kontaminiert werden und auch dieser 
Umstand das unerlaubte Auffinden der versteckten und unbekannten DNA 
Sequenz erschweren wird: vgl. z.B. D3 Spalte 9 Zeilen 20-27. (Diese 
Kontamination wird als implizit offenbart angesehen. Falls dies bestritten 
wurde, muBte in jedem Fall ein Mangel an erfinderischer Tatigkeit konstatiert 
werden, da eine solche Kontamination zu erwarten ware). 

6 Anspruch 20: siehe Anspruch 18. 



Formblatt PCT/Beiblatt/409 (Blatt2) (EPA-April 1997) 



# 

INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/E POO/02893 
PRUFUNGSBERICHT - BEIBLATT . 

7 Anspruch 21 : Implizit in D2 und D3 (Verwendung eines Primers ist ubiich bei 
Standardverfahren zur Hybridisierung komplementarer Nukleinsauresequenzen). 

8 Anspruch 22: siehe Anspruch 1 8: D2,D3 offenbaren den Verwendungszweck. 
Punkte Vll+VM 

Bestimmte Manael der internat ionalen Anmeldunq 
Bestimmte Remerkuna e n zur internationalen Anmeldunq 

9 Den Anspruchen 1 8-22 fehlen wesentliche Merkmale. Die Anspruche haben die 
Form "Verwendung von X fur Y". In den vorliegenden Fallen entspricht diese 
Formulierung einer bloBen Definition des zu Idsenden Problems, wobei nicht alle 
zur Implementation der Losung wesentlichen Merkmale angefuhrt werden (vgl. 
PCT Richtlinien III-3.4 und 4.4). So wird z.B. aus der Formulierung der Anspruche 
nicht War, wie die Polymere "informationstragend" werden. 

1 0 Es mangelt dem Anspruchsatz insgesamt an Klarheit, da es aufgrund der 
Mehrzahl unabhangiger Anspruche (mit nurteilweise uberlappendem 
Schutzumfang) schwierig, wenn nicht unmoglich ist, den Gegenstand des 
Schutzbegehrens zu ermitteln, und damit Dritten die Feststellung des 
Schutzumfangs in unzumutbarer Weise erschwert wird. 

1 1 In den Anspruchen fehlen Bezugszeichen in Klammern als Verweise auf 
entsprechende Symbole in den beigefugten Abbildungen. Klammerung anderer 
Ausdriicke in den Anspruchen macht den intendierten Schutzumfang unklar: so 
wird z.B. auf den wesentlichen Begriff "Niehaus Feldkamp Rauhe Verfahren" nur 
in Klammern (und damit ohne einschrankende Wirkung) verwiesen, wahrend im 
eigentlichen Anspruchtext bloBe Abkurzungen verwendet werden. 

1 2 Zwar wird in der Beschreibung der in dem Dokument D1 offenbarte einschlagige 
Stand der Technik diskutiert, jedoch wird weder in der Beschreibung noch im 
Anspruch unmiBverstandlich explizit gemacht, daB D1 bereits die Schritte I.IV und 
V des Verfahrens nach Anspruch 1 offenbart. 
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1 3 Bemerkung: 



Die Bedeutung verwendeter Begriffe mu(3 aus den Anspruchen selbst War 
hervorgehen. Der Begriff Niehaus-Feldkamp-Rauhe Verfahren ist nicht allgeme.n 
bekannt und muBte daher in den Anspruchen definiert werden. Da aber die 
Inkludierung des detailliert und schrittweise beschriebenen Verfahrens in voller 
Lange (vgl. pp. 14) die Lesbarkeit der Anspruche drastisch reduzieren wurde, 
erscheint in diesem speziellen Fall eine solche indirekte Bezugnahme auf die 
Beschreibung ausnahmsweise angebracht (vgl. PCT Richtlinien 111-4.10 sowie 
Regel 6.2(a)) . 
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PatentansprUche 

1. Verfahren zur Herstellung von informationstragenden Polymeren. das umfaftt, 

1. eine regulars Grammatik G = (2. V, R, S) mit elnem endlichen 
Terminalalphabet £, einer endlichen Variablenmenge V, einer endlichen 
Regelmenge R und elnem Startsymbol S zu definieren; 

II. das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung 
von Monomersequenzen; 

III. mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu 
implementieren, indem damit Monomersequenzen hergestellt werden, die die 
Regelmenge R einer Grammatik G eindeutig darstellen; 

IV. aus den in Schritt III hergestellten Monomersequenzen fur jede Regel der 
Regelmenge R von G ein die Regel reprasentierendes Oligomer 
zusa mmenzusetzen ; 

V. die in Schritt IV zusammengesetzten Oligomere zu Polymeren, welche Wdrter 
der regularen Grammatik G kodieren, zu verknQpfen. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daft das Terminalalphabet 

2 einer Grammatik G die Terminate 0, 1, n Startterminale s (s 0 , Si s n ) und m 

Endterminale e (e 0 . ei e m ). enthalt. wobei n und m jeweils grfifter oder gleich 0 

sind und eine natilriiche Zahl darstellen. 

3. Verfahren nach Anspruch 1 Oder 2, dadurch gekennzeichnet, daft die in Schritt III 
konstruierte Monomersequenz Nukleotide, insbesondere Ribonukleotide. besonders 
bevorzugt Desoxyribonukleotide umfaBt. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daB die in Schritt III 
konstruierte Monomersequenz Proteinerkennungssequenzen. z.B. Restriktions- 
schnittstellen, Proteinbindungsstellen, Stopcodons, umfalit. 

5. Verfahren nach einem der vorhergehenden AnsprQche, dadurch gekennzeichnet, 
daft man die Synthese der Monomersequenzen in Schritt II und III in vitro, 
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vorzugsweise mittels eines Oligonukleotid-Synthezisers vornimmt. 

6. Verfahren zur Isolierung und Vervielfaltigung von informationstragenden 
Polymeren, dadurch gekennzeichnet, daB man 

a) das Verfahren zur Herstellung von Informationstragenden Polymeren nach 
einem der vorhergehenden Anspruche durchfuhrt, 

b) in Schritt V erhaltene informationstragende Polymere in Klonierungsvektoren 
ligiert, 

c) kompetente Zellen mit diesen Vektoren transformiert und 

d) die erfolgreich transformierten Bakterien anhand von Selektionsmarkern 
selektioniert 



7. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, 
dadurch gekennzeichnet, daft man 

a) das Verfahren zur Herstellung von informationstragenden Polymeren nach 
einem der AnsprOche 1 bis 5 oder das Verfahren zur Isolierung und 
Vervielfaltigung von informationstragenden Polymeren nach Anspruch 6 
durchfOhrt, 

b) mindestens n-1 das informationstragende Polymer enthaltende LBsungen mit 
20 jeweils einem Paar gegenlaufiger Primer versetzt, wobei n fur die Zahl der als 

Elongatoren in dem Polymer enthaltenen Oligomere steht; 

c) mindestens n-1 PCR-Ansatze durchfOhrt, wobei n fur die Zahl der als 
Elongatoren in dem Polymer enthaltenen Oligomere steht und jeweils ein 
Primer eines jeden Paares in dem dem Elongator gegenQberliegenden 

25 Terminator primt und der andere Primer in dem Elongator selbst primt; 

d) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Lange durch 
Elektrophorese auftrennt und 

e) das aus der Elektrophorese erhaltene Muster optisch ausliest. 

wobei der Begriff „Elongator" definiert ist als Algomer mit zwei Oberhangsequenzen. 
30 der Begriff .Algomer" definiert ist als doppelstrangiges Oligomer, das eine Regel 
einer gegebenen Grammatik reprasentiert und der Begriff Jerminator" definiert ist 
als Algomer mit einer Gberhangsequeriz- 
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8. Verfahren nach Anspruch 7. dadurch gekennzeichnet, daft das Auslesen in Schritt 
e) automatlsiert durch einen Scanner Oder eine Sequenziermaschine erfolgt. 

9. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, 
5 dadurch gekennzeichnet, daft man 

a) das Verfahren zur Herstellung von informationstragenden Polymeren nach 
einem der AnsprOche 1 bis 5 oder das Verfahren zur Isolierung und 
Vervielfaltigung von informationstragenden Polymeren nach Anspruch 6 
durchfOhrt und 

10 b) die Information mit Hilfe eines Biochips ausliest. 

10. Verfahren zur Herstellung eines polymeren Datenspeichers, dadurch 
gekennzeichnet. daft man das Verfahren zur Herstellung von informationstragenden 
Polymeren nach einem der AnsprOche 1 bis 5 durchfOhrt, wobei man die 

15 Verkntlpfung der Oligomers zu Polymeren in Schritt V an einem festen Trager 
durchfOhrt. 



1 1 . Verfahren zur Herstellung eines Biochip. dadurch gekennzeichnet, dali man 

a) das Verfahren zur Herstellung von informationstragenden Polymeren nach 
20 einem der AnsprOche 1 bis 5 durchfOhrt und 

b) die informationstragenden Polymere auf einen Trager spottet. 

12. Verfahren zur Herstellung von Datenspeichern, dadurch gekennzeichnet. daB 
man 

25 a) das Verfahren nach Anspruch 10 durchfOhrt, 

b) spezifische DatenmolekOle mit dem Chip hybridisieren laBt und 

c) so einer Speicherzelle des Chip einen Wert zuweist. 

13. Verfahren zur Herstellung von optischen Anzeigegeraten oder Blldschirmen, 
30 dadurch gekennzeichnet, dafi man 

a) das Verfahren nach Anspruch 10 durchfOhrt, 
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b) spezifische Sequenzen mlt dem Chip hybridisieren laBt, die mit optisch aktiven 
MolekQIen unterschiedlicher Farbe versehen sind und 

c) so gezielt Farbmuster erzeugt. 

5 14. Verfahren zur Herstellung von Molekulargewichtsstandards, dadurch 
gekennzeichnet, daB man 

a) das Verfahren zur Herstellung von informatlonstragenden Polymeren nach 
einem der Ansprilche 1 bis 5 durchfOhrt, 

b) die in Schritt V erhaltenen infbrmationstragenden Polymere als Template einer 
10 Auslese-PCR verwendet und 

c) so ein Gemisch von DNA-Fragmenten definierter Lange und definierter 
LangenabstSnde erzeugt. 



15. Verfahren zur Herstellung biologisch aktiver MolekQIe mit kontrolliertem, 
15 programmierbaren VerknQpfen von Sequenzen, dadurch gekennzeichnet, daB man 
das Verfahren zur Herstellung von informationstragenden Polymeren nach einem der 
AnsprOche 1 bis 5 durchfOhrt, wobei man als Terminale anstelle kOnstlicher 
Sequenzen zur Darstellung von Symbolen biologisch aktive Sequenzen wle 
Restriktionssites, Rekombinationssites. Centromere, Promotoren, Exons. Gene oder 
20 andere einsetzt. 



16. Verfahren zur Markierung Oder Signierung von Erzeugnissen, Produkten, Stoffen 
pder GerSten, dadurch gekennzeichnet, daB man 

a) das Verfahren zur Herstellung von informationstragenden Polymeren nach 
25 einem der Anspruche 1 bis 5 durchfOhrt und 

b) die informationstragenden Polymere den Erzeugnissen. Produkten, Stoffen 
oder Geraten hinzufOgt. 

17. Verfahren nach Anspruch 16 zu einem Zweck, der ausgewahtt ist unter 
30 Qualitatssicherung. Falschungssicherung, Kennzeichnung gentechnischer 

Erzeugnisse, Kennzeichnung von Lebensmitteln, Kennzeichnung von Organismen, 
Kennzeichnung chemischer Erzeugnisse, Kennzeichnung medizinischer und 
pharmazeutischer Erzeugnisse, Kennzeichnung von Dokumenten, Kennzeichnung 
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von Geld, Kennzeichnung von GegenstSnden und Maschinen, Kennzeichnung von 
FIQssigkeiten. Losungen, Suspensionen Oder Emulsionen, Herstellung Oder 
Bearbeitung kleinster molekularer Strukturen, Qualitatskontrolle synthetisch 
hergestellter Oligonukleotlde, Herstellung von Biochips, Verwendung als molekulare 
5 Kleber, Authentisierung von Personen und Gegenstanden; Kennzeichnung elnzelner 
MolekQIe, insbesondere von Nukleinsauren, besonders bevorzugt von Genen. 

18. Verwendung von informationstragenden Polymeren. insbesondere von 
Polymeren, die nach einem der AnsprOche 1 bis 5 erhalten wurden. zur 

10 VerschlOsselung von Information. 

19. Verwendung nach Anspruch 18. dadurch gekennzeichnet, daB das 
informationstragende Polymer in einer Vielzahl anderer Polymers verborgen ist. 

15 20. Verwendung von Nukleinsauren zur VerschlCisselung von Information. 

21 . Verwendung von Nukleinsauren zur VerschlOsselung von Information, dadurch 
gekennzeichnet, daB zur EntschlQsselung kurze Nukleinsauresequenzen, Primer, als 
Schlussel benutzt werden. 

20 

22. Verwendung von Polymeren zum Zwecke der Kennzeichnung. dadurch 
gekennzeichnet. daB die Polymere verschlOsselt sind. 



25 
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Internationales Aktenzeichen 
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Internationales Anmeldedatum 
(Tag/Monat/Jahr) 
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(Fruhestes) Prioritatsdatum (Tag/Monat/Jahr) 

31/03/1999 


Anmelder 
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Dieser internationale Recherchenbericht wurde von der Internationalen Recherchenbehorde erstelK und wird dem Anme.der gemaB 
Artikel 18 ubermittelt. Eine Kopie wird dem Internationalen Buro ubermrttelt. 

Dieser internationale Recherchenbericht umfaBt insgesamt _J3 Blatter. 

g Daruber hinaus fiegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Techn.k be,. 



1 . Grundlage des Berichts 

a 



inaiage ae*» dci iwuo 

Hinsichtlich der Sprache ist die internationale Recherche auf der Grundlage der internationalen j^eWung " Sprache 
Sirch^rt der sie eingereicht wurde, sofern unter diesem Punkt n.chts anderes angegeben at. 

n Die internationale Recherche ist auf der Grundlage einer bei der Behorde eingereichten Obersetzung der internationalen 
' — ' Anmeldung (Regel 23.1 b)) durchgefuhrt worden. 

Hinsichtlich der in der internationalen Anmeldung offenbarten Nucleoli*- un^oder Aminosauresequenz ist die internationale 
Recherche auf der Grundlage des Sequenzprotokolts durchgefuhrt worden, das 
p~j j n der internationalen Anmeldung in Schriflicher Form enthalten ist. 

zusammen mit der internationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 
bei der Behorde nachtraglich in schriftticher Form eingereicht worden ist. 
bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 



2. 
3. 



□ 
□ 
□ 
□ 

□ 

□ 
□ 



UtM UfcTI DCTIUJIVJ^ iiaviiuw 3 ..v.. ... 1 

Die Erklarung, daB das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
internationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

Die Erklarung, daB die in computerlesbarer Form erfafiten Informationen dem schriftlichen Sequenzprotokoll entsprechen, 

wurde vorgelegt. 

Bestlmmte Anspruche haben sich als nicht recherchierbar erwiesen (siehe Feld I). 
Mangelnde Elnheltllchkeit der Erfindung (siehe Feld II). 



4. Hinsichtlich der Bezelchnung der Erfindung 

PT| wird der vom Anmelder eingereichte Wortlaut genehmigt. 
| | wurde der Wortlaut von der Behorde wie folgt festgesetzt: 



5. Hinsichtlich der Zusammenfassung 

mwird der vom Anmelder eingereichte Wortlaut genehmigt. ^ f ^ n ^ a J rw 

u^nrHo Hpr Wortlaut nach Reael 38 2b) in der in Feld III angegebenen Fassung von der Behorde festgesetzt. Der 
I-! Anmelder k^nf I der ^ard^riSi* eines Monats nach^m Datum der Absendung dieses .nternat.ona.en 
— Recherchenberichts eine Stellungnahme vorlegen. 



Folgende Abbildung der Zelchnungen ist mit der Zusammenfassung zu veroffentlichen: Abb. Nr. 
| | wie vom Anmelder vorgeschlagen 

[X| weil der Anmelder selbst keine Abbildung vorgeschlagen hat. 
| | weil diese Abbildung die Erfindung besser kennzeichnet. 



| [ keine der Abb. 
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Informationstragende und informationsverarbeitende Polymere 



Beschreibung 

Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen 
Verfahren erhaltliche informationstragende Poiymere; Verfahren zur Isolierung, zur 
Vervielfaltigung und zum Auslesen solcher informationstragender Polymere; polymere 
Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sow,e d,e 
verwendung informationstragender Polymere zur Herstellung von 
Mo.ekulargewichtsstandards, als Marker Oder Signatures zur Verschlusse.ung von 
,nformation. als molekulare Kleber oder zur Herstel.ung oder Bearbeitung kle.nster 
molekularer Strukturen. 
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Es ist bekannt, Nukleinsauren zur Markierung von Materialien zu verwenden. D.e US- 
05451505 beschreibt die .dee. Nukleinsauren der Lange 20-1000b P zur Kennzeichnung von 
Materialien zu verwenden, die zum Zwecke der Authentifizierung dienen konnen. Ganz 
grundsatzliche Probleme wie das Konstruieren von geeigneten Sequenzen oder von 
geeigneten Kodierungen zur Representation von Information werden jedoch n.cht d.skut,ert, 
geschweige denn, befriedigend gelost. 

Es ist bekannt, Nukleinsauren wie DNA (Deoxiribonucleic Acid = Desoxyribonukleinsaure) und 
RNA (Ribonucleic Acid = RibonuWeinsaure) auch auBerhalb von Organismen zur 
mformationsverarbeitung zu verwenden. Es wurden bisher verschiedene Ansatze, DNA 
Molekule zur mformationsverarbeitung zu verwenden, vorgestellt. 

Die WO 97/07440 und [L. M. Adleman, Molecular Computation of Solutions to Comb.natonal 
Problems, Science, 266. 1021-1024, (1994)] beschreiben ein Verfahren, einen Graphen- 
Algorithmus rHamiltonian-Rad-Problem") als Entscheidungsproblem mit Hilfe von DNA 
Moleku.en zu berechnen. Der Algorithmus wird implementiert. indem die Kanten und Knoten 
des Graphen als DNA Sequenzen reprasentiert werden. Die Berechnung des Algorithmus w.rd 
dadurch vorgenommen, daB durch die Hybridisierung komplementarer DNA Sequenzen e,ne 
Menge von Pfaden des Graphen erzeugt werden. 

Aus dieser Menge von Pfaden werden dann mit Hilfe molekularbiologischer Verfahren alie 
Pfade entfernt. die eine faische oder keine Losung des Akjorithmus sind. Wurden alle Schntte 
erfolgreich ausgefuhrt. so muB am Ende entweder mindestens ein DNA Strang ubrigb.e,ben, 
der die richtige Losung des Problems enthalt, oder es bleibt kein DNA Strang ubrig, was 
bedeutet, daB der Algorithmus keine Losung hat. 

Das beschriebene Verfahren setzt voraus. daB genugend viele Molekule zur Verfugung 
stehen, damit jede mogliche Losung der jeweiligen Probleminstanz statistisch m.ndestens 
einmal in der Ausgangsmenge von Pfaden vorkommt. Dies kann aufgrund der stafsfschen 
) Natur der Hybridisierungsvorgange jedoch nicht garantiert werden. AuBerdem konnen ,m 
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ersten Schritt auch zyklische Graphen entstehen, was von vorneHn die Menge falscher 
Losungen vergroBert. 

Der in WO 97/07440 beschriebene Ansatz zeigt, daB Symbolverarbeitung uberhaupt in vitro 
m.t DNA Molekulen vorgenommen werden kann. Jedoch ist der beschriebene Ansatz in der 
Praxis kaum verwendbar: Ein Problem ist, da(3 der Algorrthmus nicht deterministisch sondern 
nur stochastisch ist, das gefundene Ergebnis ist damit nur mit einer bestimmten 
Wahrscheinlichkeit korrekt. Ein weiteres Problem ist, daf3 die Implementierung des 
Algonthmus nicht effizient (Laufzeit-optimal) ist, dadurch wird die Berechnung langsam 
Es wrd dargelegt, daB das verwendete Verfahren zur Losung NP-voHstandiger Probleme 
(e.ner Klasse von Prob.emen, fur die nur deterministische Losungsalgorithmen mit 
exponentieller Laufzeit bekannt sind und von der vermutet wird, daB es keine effizienten 
determmistischen Losungsalgorithmen gibt) besonders gut geeignet sei, weil der Algorithmus 
aufgrund der Para.lelitat der ausgefOhrten Operationen nur .ineare Laufzeit benotige. Diese 
Argumentation ist jedoch insofern fehlerhaft, als die lineare Laufzeit durch eine exponentielle 
Anzahl von Molekulen kompensiert wird. Die exponentiel.e ProblemgroBe bleibt also 
unverandert bestehen. 

insgesamt ist das in der WO 97/07440 beschriebene Verfahren zu sehr eingeschrankt, urn fur 
molekulare Informationsverarbeitung Qber den beschriebenen Algorithmus hinaus verwendbar 
zu sein: Das Hamiltonian-Pfad-Problem ist fest kodiert, andere Algorithmen konnen damit 
n,cht berechnet werden, jede Probleminstanz muB neu kodiert werden. Programmierung ist 
n.cht vorgesehen, alle Schritte des Algorithmus werden von Hand ausgefuhrt. Ein input- 
/Output-System ist nicht vorgesehen. Insgesamt ist das Verfahren zur Programmierung von 
Algorithmen Oder zur Implementierung eines Computers nicht geeignet 
Die WO 97/29117 und [Frank Guarnieri, Makiko Fiiss, Carter Bancroft, Making DNA Add 
Saence, 273, 220-223, (1996)] beschreiben ein Verfahren, Additionen mit Hiife von DNA 
Molekulen auszufuhren. Die Addition erfolgt als Schiebeoperation mit Gber.auf-Ubertrag in 
vitro mit DNA Molekulen und Primer-Elongation. 

Das beschriebene Verfahren beschreibt ausschlieBlich Additionen. Jedoch ist selbst die 
Verwendung als Addierer aus mindestens zwei Grunden ungunstig: Zum einen ist Addition mit 
dem beschriebenen Verfahren nicht effizient (Laufzeit-optimal) implement. Zum anderen ist 
das verwendete System formal unvollstandig, weil die durch Addition erzeugten Ergebnisse 
.hrerseits nicht mehr als Zahlen fur Berechnungen verwendet werden konnen. Qber die 
Addifon hinausgehende Konzepte fehlen. Insgesamt ist das Verfahren zur Programmierung 
von Algorithmen oderzur Implementierung eines Computers nicht geeignet 
in [Qi Ouyang, Peter D. Kaplan. Shumao Liu, Albert Libchaber, DNA Solution of the Maximal 
Clique Problem. Science, 278, 446-449, (1997)] wird ein Verfahren beschrieben, einen 
Algonthmus zur Losung des "Max-C.ique-ProblenV's zu implementieren. Der Algorithmus 
stammt aus der Graphentheorie und fallt unter die NP-vollstandigen Probleme. Wie in [L M 
Adleman, Molecular Computation of Solutions to Combinatorial Problems. Saence 266 
1021-1024, (1994)] ist das Verfahren nur in der Lage. einen fest kodierten 
Losungsalgorithmus zu berechnen. Auch hier wird das Ergebnis nur mit einer bestimmten 



• PCT/EP00/02893 

W««h«*N-« amaTTn. Das von den Autoren beschnebene Vertahrsn engine 
„a,,e rt »,enden Konzepta (eKva in Hinsich, dor Implement aucn anderer Algorithmen). 
msgesamt ist das Verfahran zur Programmiarung von Algorithmen odar zur Implementing 

eines Computers nicht geeignet. 
5 , n [Erik Winfree, Xiaoping Yang. Nadrian C. Seeman, Universal Computat.cn v,a Self- 
assely of DNA: Some Theory and Experiments, Proceeds of t»e 2nd O.MACS MeeUng 
on DNA Based Computers, Princeton University, June 20-12, (1996)] wird erortert, regulare 
Grammatiken in DNA durch VerknOpfung von O.igonukleotiden mil "sticky ends zu 
implementieren. Die Ausfuhrungen sind jedoch rein theoretischer Natur und sche.tern an 
10 wesent.ichen, bisher unge.5sten Probiemen. Insbesondere wird nicht dargelegt w,e d,e zur 
.mplementierung von Grammatiken benotigten Sequenzen konstruiert werden mussen. 
Gerade dies ist aber das entscheidende Probiem, ohne dessen Losung Grammafken n,cht 
implements werden konnen. Der Grund dafur liegt darin, daB die Sequenzen d,e d,e 
Variab.en und Terminale einer Grammatik reprasentieren, sowohl eindeufg, ate auch 
15 untereinander hinreichend unahn.ich sein mussen. AuBerdem mussen sie best.mm e 
strukturelle, chemische und physikalische Eigenschaften erfOOen. Andernfalls s.nd 
Fehihybhdisierungen zwischen Sequenzen zwangslaufig, die bei der Po.ymerisierung zu 
ungewo.lten Kettenverlangerungen und KettenabbrOchen fuhren und damit das Funkt,on,eren 
des Verfahrens unmoglich machen. Dieses Prob.em verscharft sich mit der Anzah. der 
20 benotigten Sequenzen exponentiell. 

Das beschriebene Verfahren wird von den Autoren se.bst wieder verworfen, bzw. .nscfern als 
unzureichend bezeichnet, als es keine sonderlich interessanten Berechnungen erlaube Enk 
Winfree. Xiaoping Yang, Nadrian C. Seeman, Universa. Computation via Self-assembly of 
DNA- Some Theory and Experiments, Proceedings of tne 2nd D.MACS MeeUng on DNA 
25 Based Computers, Princeton University, June 20-12, (1996), S. 8, 2. Absatz, 1 . Ze.le). 

WeiterfOhrende Experimente der Autoren stutzen sich entsprechend auch nicht we,ter auf 
regulare Grammatiken und lineare Polymere, sondern auf kontextsensitive Grammat.ken zur 
Erzeugung von DNA Gitterstrukturen [Erik Winfree, Furong Liu, Lisa A. Wenz.er & Nadnan C. 
Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, 
30 (1998)] Der von den Autoren beschriebene Ansatz ist womfiglich zur Erzeugung DNA- 
basierter Nanostrukturen (Herste.lung von Katalysatoren usw.) gee.gnet. Zur 
.nformationsverarbeitung eignet er sich hingegen nicht, hier sind die erzeugten 
Gitterstrukturen eher hinderlich. 

Zwar sprechen die Autoren von der MSg.ichkeit, das mathematische Konzept der "Wang Wes 
35 durch die erzeugten Gitterstrukturen zu rea.isieren und damit potentiel. auch fur 
Berechnungen zu verwenden, sie b.eiben aber bei der bloBen Erwahnung einer solchen 
Moglichkeit, ohne zu beschreiben, wie dies im Sinne einer .nformationsverarbeitung genutzt 

werden kann. . 
Es ist uberhaupt zweifelhaft, ob der von den Autoren beschriebene Ansatz uberhaupt zu e.ner 
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Es ist uberhaupt zweiiemau, uu u C . vw., 

informationsverarbeitung geeignet ist: Die Gitterstrukturen verhindern die Vervelfait-gung 
informationstragender Sequenzen (z.B. durch Klonierung oder PGR = Polymerase Cha.n 
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Reaction > Polymerase Kettenreaktion) und machen es unmog.icR erzeugten Strukturen 
als Daten zu verwenden, wei. diese nicht mehr, etwa durch PGR, ausgelesen werden konnen 
Entsprechend sieht der gewahlte Ansatz in der jetzigen Form konzeptionell gar keine 
Moglichkeit vor, die erzeugten Strukturen im Sinne einer Informationsverarbeitung, etwa als 
o Daten, zu nutzen. 

Aus dem Stand der Technik ist bisher kein Verfahren bekannt, das es erlaubt, DNA Moleku.e 
fur d,e implementierung effizienter Algorithmen zu verwenden. Es ist kein Verfahren bekannt 
Berechnungen automatisch (etwa in Art eines molekularen Computers) durchzufuhren. Es isi 
10 auch e.n Verfahren bekannt, Programme in Form von regularen Grammatiken mit 
molekularen Verfahren so zu implementieren, daB damit 

a) unterschiedliche (im .dealfal, be.iebige) regu.are Grammatiken i mp .ementiert werden 
konnen 

b) die mit regularen Grammatiken erzeugten Worter einer Sprache ausgelesen werden 

» 5 konnen 

c) die mit regularen Grammatiken erzeugten Worter einer Sprache fur technische Zwecke 
(z.B. informationsverarbeitung. Polymerchemie) weiterverwendet werden konnen. 

Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren bereitzustellen 
das es erlaubt, Informationsverarbeitung au f molekularer Basis mithHfe regular 
Grammatiken vorzunehmen, ohne dabei auf eine oder wenige Grammatiken eingeschrankt zu 
se.n. Das Verfahren sol, kompatibel zu herkomm.ichen Computern sein und eine 
Informationsverarbeitung er.auben, die teilweise auf moleku.arer Basis und teilweise au, der 
Bas,s herkomm.icher Computer stattfindet. Das Verfahren so.l programmierbar und 
wertgehend automatisierbar sein. Die innerhalb des Verfahrens erzeugten Polymere so.len 
lesbar und fur weiterfiihrende Anwendungen und Verfahren verwendbar sein 
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Diese Aufgabe wird ge.6st durch ein Verfahren zur HersteHung informationstragender 

30 Polymere, das umfaBt, 

' Sine r69Ulare Grammatik G = V. R. S) mit einem endlichen Terminala.phabet Z 

e,nerend.ichen Variab.enmenge V, einer endlichen Rege.menge R und einem 
Startsymbol S zu definieren; 

das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von 
Monomersequenzen (Oligo- oder Polymere); 

mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren 
mdem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer 
Grammatik G eindeutig darstellen; 
'V. aus den in Schritt II. hergeste.lten Monomersequenzen fur jede Regel der 
Regelmenge R von G ein die Regel reprasentierendes Oligomer (Algome,) 
zusammenzusetzen (Algomer-Assemblierung); 
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II. 
III. 
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V. die in Schritt IV zXmmengesetzten Oligomere (Algomere) zu informationstragenden 
Polymeren zu verknupfen (Symboipolymerisation). 

Im Rahmen der vorliegenden Erfindung werden folgende Definitionen und Abkurzungen 
verwendet: 



Algomer 

10 Auslese-PCR 
Biochip 

1 5 Bitpolymerisation 
Byte 

Elongator 
20 Grammatik 
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Logomer 



Monomer 



Multibyte 



Doppelstrangiges Oligomer, das eine Regei einer gegebenen 
Grammatik reprasentiert. Algomere konnen miteinander zu Logomeren 
verknupft werden. 

PCR, die zum Auslesen der in Logomeren enthaltenen Information 
verwendet wird. 

Auch als Microarray, DNA-Array, Gene-Array, Gene-Chip bezeichneter 
Trager einer Anzahl von Nukleinsauren, die zur Detektion 
komplementarer Sequenzen benutzt werden. 

ProzeB des Verkettens von Algomeren zu Logomeren, wenn es nur zwei 
verschiedene Elongatoren gibt. 

Informationseinheit aus 8 Bit, bzw. Moiekul, das 8 Bit reprasentiert. 
Algomer mit zwei Oberhangsequenzen; kann mit Terminator oder 
Elongator ligieren und fuhrt zu einer Kettenverlangerung. 
Formalismus, der Sprachen beschreibt. Er basiert auf der formalen 
Theorie von Sprachen [Chomsky, N., Three models for the description 
of language, JACM, 2:3, 113-124, (1956)], [Chomsky, N., On certain 
formal properties of grammars, Inf. and Control, 2:2, 137-167, (1959)], 
[Chomsky, N., Formal properties of grammars, Handbook of Math. 
Psych., 2, 323-418, (1963)]. 

Eine Grammatik G beschreibt eine Sprache L(G), das Alphabet dieser 
Sprache und deren Syntax. Nach einer Grammatik G konnen alle 
Worter dieser Sprache erzeugt werden. 

Eine Grammatik G ist ein Quadrupel (Z, V, R, S) mit Terminalalphabet 2, 
Variablenmenge V, Startsymbol S und Regelmenge R. 
Polymer, das symbolische Informationen tragt und durch die Verkettung 
von Algomeren erzeugt wurde. Entsprechend besteht ein Logomer aus 
sich wiederhotenden Einheiten von Algomeren. Ein Logomer 
reprasentiert ein Wort einer Sprache L(G), die von der entsprechenden 
Grammatik G erzeugt wird. 

Einzelmolekul. Mehrere Monomere konnen zu langeren Ketten verknupft 
werden und so Oligomere und Polymere bilden. 

Monomere sind im Fall von Desoxyribonukleinsaure die Nukleotide 
(Adenin, Cytosin, Guanin, Thymin wie auch sog. Basenanatoga wie 
Hypoxanthin etc.). 

Eine beliebige Datenstruktur, die aus Vielfachen von Bytes besteht. 
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Oligomer 

PCR 



1 0 Polymer 
Regel 



15 Sequenz 



Komplementaritat 



Startsymbol 



25 Symbolpolymerisation 
Terminal 



Terminator 



Uniqueness 



Variable 
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Kurzkettiges Molekul aus sich wiederholenden Einheiten (Monomeren). 
Auch kurze doppelstrangige Molekule werden als Oligomere bezeichnet. 
Polymerase Chain Reaction = Polymerase Kettenreaktion; Verfahren zur 
exponentiellen Vervielfaltigung von DNA. 

Die PCR benotigt ein DNA Template, das vervielfaltigt wird, und zwei 
Primer, die jeweils gegenlaufig im Template ansetzen und als 
Startpunkte einer DNA Polymerisation fungieren. Durch iterative 
Wiederholung von Schmelzen-Hybridisierung-Polymerisations-Zyklen 
wird das DNA Template vervielfaltigt. 

Langkettiges Molekul aus sich wiederholenden Einheiten (Monomeren). 
auch: Produktionsregel, Ersetzungsregel Oder Ableitungsregel. 
Beschreibt die Ersetzung von Symbolen durch andere. Durch die 
wiederholte Anwendung von Regeln konnen Symbolketten erzeugt 
werden. 

Informatik: Abfolge von Zeichen; 

Chemie: Abfolge kovalent verbundener Monomere; 

Molekularbiologie: Abfolge kovalent verbundener Nukleotide. 

Zwei Sequenzen sind dann komplementar, wenn sie miteinander 

hybridisieren konnen. Im Falle von DNA sind z.B. die Sequenzen 

5'attt3' und 5 aaat3' komplementar, die Sequenz 5'acgt3' ist zu sich 

selbst komplementar. 

Variable innerhalb einer Grammatik, von der ausgehend, durch 
Anwendung der Regeln der Grammatik, eine Symbolkette erzeugt 
werden kann. 

ProzeB des Verkettens von Algomeren zu Logomeren. 
Symbol einer Grammatik. Ein Terminal kann nicht weiter ersetzt 
(substituiert) werden. Terminale sind die "Buchstaben" der Worte einer 
Sprache L(G). 

Algomer mit einer Oberhangsequenz. Kann nur mit Elongator ligieren. 
Fuhrt zum Kettenabbruch bei einer Symbolpolymerisation. 
Eindeutigkeit von Sequenzen untereinander. Eine Sequenz S aus 
Monomeren ist 10-unique zu einer Menge M anderer Sequenzen, wenn 
jede Teilsequenz der Lange 10 von S in keiner anderen Sequenz der 
Menge M auftritt. Die Uniqueness kann auch in Prozent angegeben 
werden. Z.B. sind 2 Sequenzen der Lange 20, deren iangste 
gemeinsame Teilsequenz 5 Monomere betragt, zueinander 6-unique, 
ihre Uniqueness in Prozent betragt: (1 - 5/20) * 100 = 80%. 
Symbol einer Grammatik. Eine Variable kann gemaB der Regel einer 
Grammatik von Terminalen, Variablen oder Kombinationen von 
Terminalen und Variablen ersetzt werden. 
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Kurzbeschreibung der Abbildungen 

Abbildung 1: Algomere, wie in der Er.auterung zu Schritt IV des erfindungsgemaBen 
Verfahrens beschrieben. Die Algomere besitzen jeweils eine doppelstrangige Kernsequenz. 

5 die ein Terminal einer gegebenen Grammatik darstellt und mindestens eine einzelstrang.ge 
Oberhangsequenz, die eine Variable der gegebenen Grammatik darste.lt, so daB jeweils e.n 
Algomer genau eine Rege. der gegebenen Grammatik reprasentiert. X und Y sind kerne 
Variables sondem Oberhangsequenzen. die z.B. fur eine Klonierung benutzt werden kbnnen. 
MR Oberstrichen dargeste.lte Buchstaben kennzeichnen Komplementaritat. GemaB der 

1 0 Definition sind AOA und A1 A E.ongatoren, XsA und AeY Terminatoren. Die hier dargestellten 
Algomere reprasentieren die im Fo.genden beschriebenen Grammatik zur Erzeugung b.narer 
Zufallszahlen. 

Abbildung 2: Symbolpolymerisation, wie in der Erlauterung zum erfindungsgemaBen Schritt V 
15 beschrieben. Algomere werden durch Verkettung (im Falle von DNA: Hybridisierung und 
Ligation) zu Logomeren verknupft. Das Logomer Xs01010101eY beinhaltet eine termimerte 
Bitfolge, die durch die Uberhange X und Y in einer definierten Orientierung vervelfalt.gt 

werden kann. 

20 Abbildung 3: Muster, das die Symbolpolymerisation fur binare Zufallszahlen nach 
Gelelektropnorese und Farbung zeigt (Spuren 1-3). Aufgrund der zufa.ligen Lange der bmaren 
Zufallszahlen ergibt sich ein regelmaBiges Leitermuster. Spur 4 zeigt einen 50bp 
Molekulargewichtsstandard (Gibco BRL, Life Technologies, Katalog Nr. 10416-014). 

25 Abbildung 4: Klonierung eines durch Symbolpolymerisation erhaltenen Logomers in einem 
Vektor, wie zu Vervielfaltigung und Isolierung von Logomeren im Folgenden beschrieben. 

Abbildung 5: Schematische Darstellung eines Bandenmusters, das durch Auslesen eines 
binaren Logomers durch PCR und nachfolgende Gelelektropnorese erhalten w.rd («m 
30 Folgenden beschrieben). Im gezeigten Beispiel haben die Algomere eine Lange von 30b P 
(Oberhangsequenzen nur 1/2 gerechnet). Bei bekannter Lange des Logomers re.cht es, 
jeweils nur Oen Oder nur 1en auszulesen. Beide Bits auszulesen dient der Kontrolle. Das 
Verfahren kann auch fur mehrwertige Logomere (mehr a.s 2 Elongatoren) verwendet werden. 

35 Abbildung 6: Bandenmuster einer Gelelektrophorese nach PCR zum Auslesen von drei 
verschiedenen Logomeren. Die Logomere wurden nach der im Folgenden beschriebenen 
Grammatik fur Zufallszahlen beliebiger Lange erhalten. Als Zufallszahlen von unten nach 
oben gelesen ist a = 262, b = 97, c = 329. M (Spur 5) ist ein 50bp Molekulargewichtsstandard 
(Gibco BRL, Life Technologies, Katalog Nr. 10416-014). 
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Abb du ng 7: Schematiscne Darste|)ung Aus|eseps W Logomeren 

Resr lkl onsverdau wie i m Fo , ge nden beschrieben. Die E.ongatoren tragen 
Restr.kt.onsschnittste.. e n, die derart asymmetrisch angeordnet sind, daB der 
Restnktionsverdau von Logomeren in einem eindeutigen Schnittmuster von Fragments 
5 resu ,ert. Das Schnittmuster entspricht Banden verschiedener Lange, und kann durch 
Ge, ele tr 0phoreS e sichtbar gemacht werden. R1 und R2 sind unterschjedlicne 
Restr,kt,onsenzyme, x und y bezeichnen die Lange der nach Restriktionsverdau erhaitenen 
Fragmente. ZweckmaBig istz.B. ein Verhaltnis x:y von 1:2. 

10 Abbi.dung 8: Bandenmuster, die durch Geleiektrophorese nach dem Aus.esen von 
Logomeren durch Restriktionsverdau erhalten werden. Spur 7 und 8 enthalten 
Molekulargewichtsstandards (Spur 7- 50Db Leiter Gj h ™ rdi . t u. . - 
10416-014; Spur 8: 10bp Leiter) Techno.og.es, Katalog Nr. 

15 Abbildung 9: Schematise Darstellung eines poiymeren Datenspeichers auf der Basis von 
Algomeren und Symbolpoiymerisation wie im Nachfoigenden beschrieben. Algomere konnen 

Sch T m r Q,e (AM)> ^ " 6inem f6Sten TrS9er (C) 96bUnden * PO'y-risieren. Das 
Schre^ben (W) erfo.gt durch die wiederholte Abfolge (ReW) von Hybridisierungs-Ligations- 
Restnkt.onszyk.en (Hyb, Lig, Res). Durch Denaturieren oder Restriktion (Den/Dig) kSnnen die 
20 erhaltenen Logomere abgetrennt und ausgelesen werden. 

Abbiidung 10: Vereinfachte DarsteNung der Bestandtei.e eines DNA Desktop Computers wie 
im Nachfoigenden beschrieben. Im Einzelnen sind: 

A: O.igo-Synthesizer, B: Thermozyk.er, C: Reaktionskammern, D: Pipettiervorrichtung, E: Ge. 
25 F: Scanner, G: Steuerungscomputer 
Es kennzeichnen: 

1 : Zugabe von OHgonukteotiden, 2: Zugabe synthetisierter O.igomere in Reaktionskammern 
des Thermozyk.ers, 3: Zugabe von LSsungen und Mo.ekO,en, die zur Aigomer-Assembiierung, 
^ Symbo. P o.ymer,ation, zur .so.ierung von Logomeren und zum Aus.esen benotigt werden. 

Abbi.dung 11: Versch.usse.ung von Logomeren wie im Folgenden beschrieben. Sind die 
Term,natoren und die darin primenden Primer unbekannt, so ist das jewei.ige Logomer 
versch.usse.t und kann nicht ausge.esen werden (A). ,st dagegen ein in einem Terminator 
pr.mender Pnmer verfugbar oder die Sequenz eines Terminators bekannt, so kann das 
jeweilige Logomer gelesen werden (B). 

CerscNOs T Y " f T mi96S MO,ekQ, • ^ Terminat ° r b6i d6r -V-etrischen 

Versch.usse.ung von Logomeren verwendet werden kann. E.ongatoren konnen an das mit 2 

mark.erte Ende angeknupft werden. weitere, z.B. Y-formige, Mo.eku.e an die mit 1 und 3 
40 beze.chneten Enden. Werden mehrere Y-formige MCeku.e miteinander verknupft. so erha.t 
man baumartige Strukturen. 
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A «,dun 9 13: Logger m — - * « a, S baumartige S.,uK« U ren reatsiert 

sind. 

, AbbUdung 14: Mi. einem Vektor V verknupt.es Logomer L ml. baumartigen Terniinawen. Die 
£JL s,nd so kons.ru*,, daG iewe,,s nu, ein Ast das Terminal m,, dem Vek.0, 

verknupft werden kann. 

Abbildung 15: Markierung von Nukleinsauren mit Logomeren wie im Nachfolgenden 
0 beschrieben: Urn gentechnisch hergeste.lte oder ve.nderte Produce ^ -» « 
Logomer mithiKe rekombinativer Techniken in einen nicht-transkrib.erten Ber ei ch, z.B. vor den 
Promoter (P) eines zu markierenden Genes (G), eingesetzt. 

Abbildung ,6: Markierung von Dokumenten mit Logomeren wie im 
l5 beschrieben. Spur 1 zeigt den verwendeten Mo.e k u,argewichtsstandard (50bp, G.boo BRU 
Life Technologies, Katalog Nr. 1041*014). Spur 2 (0-Bits) und Spur 3 «) das 
Bandenmuster des Aus.esens von Logomer Nr. 330 durch PGR aus wassnger Losun *e 
Spuren 4 und 5 dasse.be wie die Spuren 2 und 3, wobei hierbei jedoch das Logome, ^330 
nicht aus wassriger Losung, sondern in ca. 10* Mo.ekulen/,. getrocknet auf Pap,er (3M Post- 
20 It, 1 Stunde getrocknet) als Papierschnipsel (ca. 1mm 2 ) in die Auslese-PCR eing.ng. 

Abbildung 17: Herste.lung von Molekulargewichtsstandards durch Auslese-PCR. die ein 
unares Logomer als Template enthalt, wie im Nachfolgenden beschrieoen. 1 ze,gt d,e 
Anordnung verschachtelter Primer in der Auslese-PCR. 2 das nach Gelelektrophorese der 
25 PCR-Fragmente erhaltene Bandenmuster. 

Abbildung 18: Verk.eben von Flachen mit Nukleinsauren wie im Nachfolgenden beschrieben. 
C bezeichnet die zu verklebende Flache, Log die Logomere, die zum Verkleben an d,e 
Flachen gebunden werden. 1 zeigt das Verhalten von Flachen mit nicht-komplementaren, 2 
30 das Verhalten von Flachen mit komplementaren Logomeren. 

Abbildung 19: Verkleben von Flachen mit Logomeren, Antikorpern und Liganden wie im 
Nachfolgenden beschrieben: C 0 und C, bezeichnen die zu verklebenden Flachen, d» aus 
gleichem oder unterschiedlichem Material bestehen konnen. Die zu verklebenden Flachen 
35 sind mit Logomeren (Log) versetzt. An die Logomere konnen Proteine, z.B. Antikorper vom 
Typ Ab A und Ab B binden, wobei Ab A und Ab B gleich Oder verschieden sein konnen. Ab A 
und Ab B sind ihrerseits durch einen Liganden (Li) miteinander verbunden. 
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Abbildung 20: Verkleben von F.achen mit Proteinen z.B. Antikorpern ohne Verwendung von 
Logomeren. C 0 und C, bezeichnen die zu verklebenden Flachen, die aus g.eicherr , oder 
unterschiedlichem Materia, bestehen konnen. Die Proteine vom Typ Ab A und Ab B b,nden 
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direkt an die zu verklebenden Rachen Z sind ihrerseits dSeinen Liganden (Li) 

miteinander verbunden. 

Abbi.dung 21 : Bei der Verknupfung von Sequenzen zu .angeren Sequenzketten kann es zu 
Ve etzungen der vorgegebenen Uniqueness kommen, die Feh.hybridisierungen und dami. 

HZ d ^ Zi6hen k3nn - 0165 ^ ^ EntSt6hen ™* Basissequenzen (in 

der Abb.ldung markiert) aufgrund der Verknupfung zuruckzufuhren. 

Abbi.dung 22: Beispie, des Verknupfens von Terminal mit einer Variabien. Durch die 
geze ig ten v,er Regein einer Grammatik mit der Variabie A ergeben sich vier verschiedene 
Rade d,e sich uber die Lange der Variab.ensequenz fur A uberschneiden. AuBerdem 
ube schne-den sich auch einige Sequenzen fur mehrfach vorkommende Terminate (b, c) so 
da(3 links und rechts je drei Pfade zusammenlaufen. 

15 Abbiidung 23: Haben mehr a.s vier verschiedene Variab.ensequenzen (A, B, C D E) 
Uberg, n g e 2U der gleicnen Termina|sequenz (Q) so mjndestens ejne 

mehrfach verwendet werden. Der gepunktete Rahmen zeigt den Iterationsschritt an in der 
Zen 9 UniqU6neSS t0 ' eriert W6rden mUB ' Um Re96,n 9US R ° bersetzen - 

20 

AbMdung 24: Pa,a„a,as AufMan z«aia, Saguanzenvadangerungan ,u, d,a Variablan A und 

TT Rahmen Ze ' 9 ' ^ " era,to " ssch * *" *» * S,a rt ba steseq uenzen «r dia 
Pfadsucha „agan. Ab dam nacbstan ,,era ti ons S chntt k6 nne„ gg,. Vadattungan dar 
Un,guanas s .ufenad „a rde , Zu baacntan fet , ^ ^ ^ J * 

25 gruppangranzan hinwag argaban (z.B. das Tarsals b zu dan Variablan A und B). 

AbbHdung 25: Ski2Z a ainas ,. Byle raprasantiarandan MCakuis. Da, m x maduada Abscnnm 
en,ha, a,na a m dau,ga Saguanz. » ainan daMadan Bytawad daraM, ,d,e ,a, » 

30 au« 7 B T rte ben6Wen ^ N ***~-- - * Se q uanzp ro .o to » 

B Ja2T H k S * AbSChnl " "*" e ' ne S «>— ■ * * 

^pcrT " ' nnerha,b U °" MU "' byKS k0disrt u " d *■* * 

u H.1T Se<,UenZPro,0k01 "- ° te m « • « a madman Abschniaa d te „an 

^z^rr" aus ein2e,nen By,es und ais ~ pcr — 

35 

, S ° hema,fe0,,e DarSte "^ ™ *' I"** M0la k u te n mi , untarscbiadiichan 
BytapoaWnan (a, - s,). Dia Einza,by,as konnan zu Multibus varbundan wardan. 
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Abbildung 28: Beispiel deT Konstruktion eines Byte-reprasentierenden DNA Molekuls. Das 
Molekule besteht aus mehreren funktionellen Untereinheiten: Fur X gibt es 256 eindeutige 
Basenfolgen die alle Werte eines einzelnen Bytes darstellen. S ist eine eindeutige Sequenz, 
die die Position eines Bytes (das im Strang unmittelbar folgende X) innerhalb von Muitibytes 
5 reprasentiert. O und E dienen als eindeutige Erkennungssequenzen fur die Verkettung 
einzelner Bytes zu Muitibytes. 

DNA Bytes konnen unverkettet oder verkettet zur Kennzeichnung verwendet werden. Durch 
das Ausschneiden der X Oder der SX Untereinheiten werden DNA Abschnitte gewonnen, die 
fur das "Spotten" von Biochips verwendet werden. Die so hergestellten Biochips werden 
1 o ihererseits zum Auslesen von einzelnen Bytes oder Muitibytes verwendet. 

Abbildung 29: Verkettung von Bytes zu Muitibytes. Im Beispiel werden 4 Bytes zu einer 32-bit 
Datenstruktur verknupft. AuBerdem konnen die endstandigen Sequenzen L und R als Adapter 
fungieren, um die 32-bit DNA Datenstruktur in andere DNA einzubringen. Sie konnen 
15 entweder spezifische Rekombinationssites oder Restriktionssites tragen. Ein Beispiel ist die 
Kennzeichnung eines Plasmids in Abbildung 31 . 

Abbildung 30: Schematischer Aufbau eines 32-Bit Molekuls, das durch Verkniipfung von 4 1- 
Byte Molekulen hergestellt wird. Das Molekul kann zum Zwecke der Kennzeichnung den zu 
20 markierenden Substanzen beigemischt oder angeheftet werden. Zur Kennzeichnung von 
Nukleinsaurekonstrukten und Genen konnen die mit L und R bezeichneten Sequenzen 
Restriktions- oder Rekombinationssites tragen, durch die sie mit dem zu markierenden 
Molekul verbunden werden. 
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Abbildung 31: Kennzeichnung eines Plasmids duch ein 32-bit Molekul. Das nullte Byte hat den 
Wert 109, das erste den Wert 67, das zweite den Wert 35, das dritte den Wert 192. Als 32-B.t 
Zahl ohne Vorzeichen entspricht das Bytemuster des gekennzeichneten Plasmids der Zahl 
3223536493. 

Abbildung 32: Skizze eines 1-Byte Biochips, der mit alien 256 x-Fragmenten (siehe Abbildung 
25 bis Abbildung 28) von x„ bis x 255 gespottet wurde (X-Chip). Dargestellt sind nur einige der 
256 unterschiedlichen Sequenzen. Zum Auslesen von Muitibytes werden die jeweiligen 
Einzelbytes mit PCR voramplifiziert (s bis e) und einzeln auf getrennten Chips hybridisiert. So 
sind fur ein 4-Byte Molekul (siehe Abbildung 30) 4 PCR Reaktionen und 4 Chips erforderlich. 

Abbildung 33: Skizze eines 1-Byte Biochips, der mit alien 256 s 0 x-Fragmenten (siehe 
Abbildung 25 bis Abbildung 28) von s 0 x 0 bis s 0 x 255 gespottet wurde (SX-Chip). Dargestellt s.nd 
nur einige der 256 unterschiedlichen Sequenzen. Im Gegensatz zum Chiptyp aus Abbildung 
32 konnen hier die Hybridisierungsbedingungen so gewahlt werden, daB Bytes abhangig von 
ihrer Position in einem Multibyte detektiert werden. Im Beispiel werden nur so* aber keine s„x, 
mit n * 0 detektiert. Analog lassen sich 1-Byte Chips herstellen, die nur Sl x, detektieren usw.. 
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Das ermoghcht es, Chips herzustellen, die Multibus direkt (ohne^R) und volistandig lesen 
konnen. Ein Beispiel ist der in Abbildung 37 gezeigte 4-Byte Chip. 

AbbHdung 34: Layout des 1-Byte Chips, .st der Chip a.s X-Chip im P ,ementiert (siehe 
5 Abbildung 32) enthalt er 256 Spots mit a.len 256 x-Fragmente (siehe Sequenzprotoko.l), ist er 
als SX-Ch,p (siehe Abbildung 33) implementiert enthalt er 256 Spots mit alten SiX-Fragmenten 

Jedes x-Fragment reprasentiert genau einen Bytewert (x 0 = 0, x, = 1 x 255 = 255) Die 

Sequenzen fur s und x sind so gewahlt, daB sie untereinander mog.ichst ahnliche 
Schmelztemperaturen haben, dabei aber moglichst unterschied.iche Sequenzen, um 
10 Fehlhybridisierungen auszuschlieBen. 

Abbildung 35: Herstellung von Multibyte-Chips aus 1-Byte SX-Chips. Im Beispiel ist die 
Herstellung eines 4-Byte Chips aus je einem SX 0 -, SX,-. einem SX 2 - und einem SX 3 -Chi P 
gezeigt. Multibyte-Chips konnen z.B. zu linearen (a) oder 2-dimensiona.en (b) Byte-Arrays 

15 angeordnet werden. 



Abb,ldung 36: Auslesen eines 32-Bit Molekuls (siehe Abbildung 30 und Abbildung 31) mit 
e.nem 4-Byte SX-Chip (siehe Abbildung 35). Zum Auslesen konnen 32-Bit MCeku.e direkt mit 
dem gesamten Chip hybridisiert werden. Dadurch kann der 32-bit Wert direkt ausgelesen 
20 werden (im Beispie, markiert). AuBerdem konnen die Bytes auch unabhangig voneinander mit 
PCR amplifiziert und getrennt voneinander hybridisiert werden. 

Arternativ dazu kann ein Multibyte-Chip auch aus identischen 8-Bit Einheiten aufgebaut sein 
d.e nur mit X-Fragmenten gespottet sind. Um die Positionsinformation der Bytes 
be,zubehalten mussen dann die einzelnen Bytes getrennt voneinander in den jewei.s 
25 korrespondierenden Sektoren gespottet werden. 

Abbildung 37: Mu.tibyte Array aus identischen 1-Byte Chips (X-Chips). Mu.tibyte Arrays aus X- 
Ch, P s konnen ebenfalls zum Auslesen von Markierungsmolekulen verwendet werden wie 
bere,ts beschrieben wurde. AuBerdem konnen MuUibyte Arrays zum Speichern und fur die 
30 optische Anzeige von Computerdaten verwendet werden. 

Sequenzprotokoll: Molekule, die fur die Herstellung der unten beschriebenen 32-Bit Molekule 
benotig, werden. Die Mo.e k u le werden wie unten beschrieben zu A.gomeren 
zusammengesetzt. Die o, s, e und x Einheiten werden wie unten beschrieben zu Bytes 
35 zusammengesetzt. Diese werden wiederum wie unten beschrieben zu Multibus (im Beispie. 
zu 4-Byte = 32-B.t Molekulen) zusammengesetzt. Die 32-Bit Molekule werden ihrerseits z B 
zur Kennzeichnung und Markierung verwendet und auBerdem zur Herstellung von Biochips 
(wie unten beschrieben) verwendet. 
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Erlauterung zu 1: Wahl von Grammatiken 

Eine Grammatik ist ein Quadrupel G = (Z, V, R, S) mil einem endlichen Terminalalphabet S, 
einerendlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbo! S. 
5 Fur eine Sprache L(G), die durch G beschrieben wird, konnen alle Worter aus L als Worter 
uber dem Terminalalphabet Z gebildet werden, indem man das Startsymbol S entsprechend 

den Regeln aus R ableitet. 

Die Definition einer Grammatik G nach Schritt . des erfindungsgemafien Verfahrens .st 
insofern frei, als beiiebige, endliche Mengen von Terminalen und Variablen kodiert werden 
10 konnen. ErfindungsgemaG bevorzugt ist jedoch die Definition von Grammatiken, d.e d.e 
Binardarstellung von Daten gestattet, insbesondere von Grammatiken mit 

S:= {0, 1, so, 8,. s 2 , .... s, n , s n , e 0 , e,. e 2 e m „ e m } mit n, m e IN und n, m > 0. 

Diese ermoglichen die Herstellung binarer Logomere. 

Zur Veranschaulichung wird im Folgenden eine erfindungsgemaB definite regulare 
15 Grammatik zur Erzeugung von Zufallszahlen beliebiger endlicher Lange in Binardarstellung 

gezeigt: 

Es sei eine Grammatik G = <£. V, R, S) mit Terminalalphabet Z:= {0, 1, s, e}, Variablenmenge 
V:={A}, Startsymbol S und Regelmenge 
R:= 
20 { 

S:=sA 
A->0A 
A->1A 
A->e 
25 }, 

wobei 
s:= Start 
e:= Ende 
sind. 

30 

Mit dieser Grammatik konnen Worter uber dem Terminalalphabet 

gebildet werden. Alle Worter der Sprache L beginnen mit „s« und horen mit fl e« auf. 
dazwischen befindet sich eine zufallige Anzahl (auch 0) zufalliger Bits („0<< und 
35 Worter aus der Sprache L, die nach R gebildet werden, sind beispielsweise: 

a) S->sA->se 

b) S->sA->s1 A->s1 e 

c) S->sA->s0A->s00A->s001 A->s001 0A->s001 Oe 

d) S->sA->s1 A->s1 0A->s1 00A->s1 000A->s1 0000A->s1 00000A->s1 OOOOOe 

40 
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Die als Worter der Spache L erzeugten Binarmiter konnen als 2ige jedoch eindeutige 
Darstel.ung von Datentypen, z.B. als Buchstaben, Zahien, aiphanumerische Zeichen Oder 
Ze,chenketten geiesen werden. Liest man sie als die BinardarsteHung von Zah.en, so sind die 
obigen Worter in Dezimaldarstellung: 

a) 0(leer) 

b) 1 

c) 2 

d) 32. 



Erlauterung zu II: das NFR-Verfahren zur Herstellung von Monomersequenzen 

Das NFR-Verfahren (Niehaus-Fe.dkamp-Rauhe-Verfahren) ist ein Verfahren zur Herstellung 
von Monomersequenzen (Oligo- und Polymeren, z.B. Nukteinsauren). das gewahrleistet, da* 
1 5 die mithilfe des Verfahrens hergestellten Monomersequenzen: 

a) eine eindeutige und einzigartige Abfolge von Monomeren haben- 

b) zueinander mog.ichst unahnlich sind und daher mog.ichst keine Fehlhybridisierungen 
untereinander eingehen; 

c) bestimmte strukturehe Eigenschaften aufweisen, z.B. ein bestimmtes Verhaltnis der 
verschiedenen Monomere zueinander, das Enthaltensein oder Nicht-Enthaltensein 
b es t,mmter Teilsequenzen und eine maximal Obereinstimmung (HomCogie) 
untereinander; y ' 

d) bestimmte chemische Eigenschaften aufweisen, z.B. das Vorkommen bestimmter 
chemisch aktiver Teilsequenzen, die EinfiuB auf chemische Reaktionen, im Fa.ie von 

25 Nuklemsauren insbesondere die Wechselwirkung mit P rote inen haben 

(Prote.nbindungsstellen, Restriktionsschnittstellen, Stopcodons)- 

e) bestimmte physika.ische Eigenschaften aufweisen, 'z.B. eine bestimmte 
Schmelztemperatur. 

30 Das NFR-Verfahren ertaubt die Herstellung eindeutiger, moglichst unahnHcher 
Monomersequenzen mit vordefinierbaren strukture.len, chemischen und physikaiischen 
E.genschaften. Es eignet sich zur Herstei.ung von Monomersequenzen fur kontroHierte 
chem.sche Reaktionen, wie sie z.B. fur eine mo.eku.aren Informationsverarbeitung benotigt 
werden. Es wird in Schritt ... des erfindungsgemaBen Verfahrens fur die .mp.ementierung 

35 regularer Grammatiken verwendet. 

Das NFR-Verfahren ist eine erfindungsgemaBe Fortbi.dung des Niehaus-Verfahrens zur 
Erzeugung eindeutiger, mog.ichst unahn.icher Sequenzen. das in [Jens Niehaus DNA 
Computing: Bewertung und Simu.ation, Di P ,o ma rt>eit am Fachbereich lnformam der 

40 Un " erS '*\ DOrtmUnd - Lehrstuhl (1998)] beschrieben ist, und worauf hiermit in 

40 vollem Umfang Bezug genommen wird. 
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Das NFR-Verfahren ist^ofern eine erfindungsgemaBe Fortbildung des Niehaus-Verfahrens, 
als erst das NFR-Verfahren die Herstellung von Monomersequenzen erlaubt, w.e s.e fur e.ne 
Herstellung in vitro, z.B. zur Impiementierung von Grammatiken, benotigt werden. D,e Grunde 
sind im Einzelnen: 

a)D as Niehaus-Verfahren beschreibt nur die Konstruktion von Sequenzen aus 
Basissequenzen der Lange 6. Da die Lange von Basissequenzen die maxima, zwischen 
verschiedenen Monomersequenzen moglichen Oberlappungen beschre.bt, daher 
unmittelbaren EinfluB auf das Hybridisierungsverhalten von Sequenzen und das 
Funktionieren der erfindungsgemaBen Schritte iV und V hat, muB das Verfahren jedoch fur 
3 Basissequenzen beliebiger Lange veraligemeinert werden. was im NFR-Verfahren 
vorgenommen wurde. 

b) Das Niehaus-Verfahren erlaubt nur die Erzeugung von Sequenzen gle.cher Lange, 
wohingegen das NFR-Verfahren Sequenzen unterschiedlicher Lange und untersch,edl,cher 
Anzahl erzeugen kann. Letzteres ist fur ein korrektes Hybridisierungsverhalten von 

5 Sequenzen und das Funktionieren der erfindungsgemaBen Schritte IV und V unerlaBhch. 

c) Das Niehaus-Verfahren gewahrleistet Eindeutigkeit und maximale Unahn.ichkert von 
Sequenzen nur fur Sequenzen, die durch eine einma.ige Anwendung des Verfahrens 
erzeugt wurden. Zwingend erforderlich ist jedoch, auch zu schon existierenden Sequenzen 
jeweils kompatible. d.h. eindeutige und maximal unahn.iche Sequenzen erzeugen zu 
k6nnen Das NFR-Verfahren kann im Gegsatz zum Niehaus-Verfahren zu beiiebK, 
vorgegebenen Sequenzen kompatible (d.h. eindeutige und maximal unahnhche) neue 
Sequenzen erzeugen. Dabei kann das Verfahren beliebig oft auf dieselbe Menge von 
Sequenzen angewendet werden. 

d)D as Niehaus-Verfahren beschrankt zwar die maximale Lange gememsamer 
Teilsequenzen, jedoch nicht deren Anzahl. Daher konnen 2 beliebige nach dem N.ehaus- 
Verfahren konstruierte Sequenzen mehrere gemeinsame Teilsequenzen beinhalten, was 
ungewollt zu einer hohen Homologie (Sequenzubereinstimmung) fuhren kann. D.e 
Homologie hat ihrerseits unmittelbaren EinfluB auf das Hybridisierungsverhalten von 
Sequenzen und das Funktionieren der erfindungsgemaBen Schritte IV und V. Das NFR- 
Verfahren dagegen fuhrt bei der Konstruktion von Sequenzen auch e.nen 
Homologievergleich durch und vermeidet dadurch ungewollte Fehlhybridisierungen. 
e) Das Niehaus-Verfahren erlaubt nicht die Integration bestimmter, vorgebbarer Sequenzen 
und Teilsequenzen. Solche Sequenzen sind jedoch fur die Ausfuhrung und Kontrolle 
bestimmter chemischer Reaktionen, z.B. kontro.lierter enzymatischer Wechselwirkungen, 
35 zwingend notwendig. Beispie.e fur solche Sequenzen sind im Falle von Nuk.einsauren 
Proteinbindungsstellen, Restriktionsschnittstellen und Stopcodons. Dagegen erlaubt das 
NFR-Verfahren die Integration beliebiger Sequenzen und Teilsequenzen in die Herstellung 
von Monomersequenzen und gewahrleistet gleichzeitig Eindeutigkeit und max.male 
Unahnlichkeit. 

40 f) Das Niehaus-Verfahren sieht keine Moglichkeit vor, Sequenzen mit best.mmten 
strukturellen, chemischen Oder physikalischen Eigenschaften zu erzeugen. Dagegen 
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enthalt das NFR-Verfahren die Moglichkfit, Sequenzen mi^stimmten strukturellen 
chem 1S chen und physikalischen Eigenschaften herzustel.en. Dazu zahlen ua das 
Verhaltnis verschiedener Monomere zueinander und die Schmelztemperatur. Auch dies ist 
fur die implementierung von Grammatiken in vitro eine unbedingte Voraussetzung 
9) Das Niehaus-Verfahren er , au bt keine direkte Erzeugung regelreprasentierender 
Sequenzen, wie sie zur «m P .ementierung von Grammatiken benotigt werden. Dagegen 
ermog.icht das NFR-Verfahren die Erzeugung symbo.reprasentierender Sequenzen die 
zu den fur die Implementierung einer Grammatik benotigten regelreprasentierenden 
bequenzen verknupft werden konnen. 
h) Nur mithHfe des NFR-Verfahrens konnen Sequenzen auch so konstruiert werden daB die 
E,genschaften der Eindeutigkeit, maxima.en Unahnlichkeit sowie strukturelle, chemische 
und physika.ische Eigenschaften auch fur TeHsequenzen gelten. Z.B. lassen sich im Falle 
von Nukleinsauren Monomersequenzen so herste.ien, daB sowohl die Gesamtsequenz a.s 
auch z.B. das erste Drittei der Sequenz einen 50%igen GC-Antei. haben. oiese 
Bgenschaft ist z.B. fur das Funktionieren der Verkettung von Sequenzen, die pro Molekul 
fur mehrere Hybridisierungsereignisse vorgesehen sind (wie z.B. die im Fo.genden 
beschriebenen Algomere), eine unbedingte Voraussetzung. Nur so lassen sich zB 
Sequenzen so konstruieren, daB unterschiedliche Hybridisierungsereignisse pro Molekul 
gleichwahrscheinlich sind. 

0 Nur das MFR-Verfahren erlaubt die unmittelbare, automatische HersteHung von 
Monomersequenzen, z.B. durch einen Oiigonukleotidsynthesizer 

J) Bei der Verknupfung von Sequenzen zu langerkettigen Sequenzen kann es zu 
Verletzungen der Uniqueness kommen. Fur die korrekte HersteHung von Polymeren durch 
das Verknupfen von Oligomeren (wie z.B. das Verknupfen von A.gomeren zu Logomeren) 
.st es unbedingt erforderlich, daB diese Uniqueness-Ver.etzungen nur in einem 
vordefinierten Bereich auftreten, damit keine unkontroliierten Fehlhybridisierungen 
auftreten (siehe Abbildung 21). Dieses Problem tritt ganz grundsatzNch auf und muB 
■nsbesondere fur die Verknupfung von Algomeren und die Verknupfung von Variab.en und 
Term.na.en gelost werde, wei. sonst eine Obersetzung von Grammatiken in Moleku.e 
unmognch ist. Das Niehaus-Verfahren lost dieses Problem nicht und ist daher fur die 
Ubersetzung von Grammatiken in Molekule ungeeignet. Das Problem wird unter 
Verwendung des NFR-Verfahrens durch eine "ParaHel-Extension" Strategie gelost Diese 
wird im Folgenden erlautert. 

Zur HersteHung von Monomersequenzen werden diese durch das NFR-Verfahren konstruiert 
und synthetisiert. Zur HersteHung von n Monomersequenzen wird das NFR-Verfahren wie im 
Fogenden beschrieben durchgefuhrt, wobei zur Beschreibung des Verfahrens folgende 
Abkurzungen benutzt werden: 
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Sseq 
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bas 



^bas 



lov/lseq 



ibas/'seq 



M seq 
M baS 
25 Mnobas 



jMnobasI 

n 

n to t 

fimax 

h 



Alphabet der Machtigkeit a e Z7V; 

Im Falle von DNA ist A:= {a, c, g, t} und a = 4. 

Sequenz. 

Folge von Elementen des Alphabets A, das einer Sequenz aus Monomeren 
entspricht. 

Lange der pro Verfahrenszyklus zu konstruierenden Sequenzen. 
Sequenz der Lange 'seq* 

(k-1)-tes Monomer der Sequenz S seq (k e Z7V; k <= l se q). 

Lange der pro Verfahrenszyklus zur Konstruktion von Sequenzen 
verwendeten Basissequenzen. 
Es gilt: 0 < l ba s <= Ueq • 

Sequenz der Lange l bas = Basissequenz; Sequenzen der Lange l seq werden 
aus Basissequenzen konstruiert. 

maximale Lange der Kette aufeinanderfolgender Monomere, die jeweils zwei 
durch das Verfahren erzeugte Sequenzen gemeinsam haben („overlap"). 

lbas * "t * 

Verhaltnis von maximal erlaubter Sequenzwiederholung zu 
Sequenzgesamtlange; 

1 . MaB fur die Fehlhybridisierungswahrscheinlichkeit. 
Verhaltnis von Basissequenzlange zu Sequenzgesamtlange; 

2. MaB fur die Fehlhybridisierungswahrscheinlichkeit. 
Menge von Sequenzen. 

Menge aller Basissequenzen der Lange l bas . 

Teilmenge der Menge von Basissequenzen der Lange l bas . die durch 
Dekomposition aus M seq erhalten wird. 

Machtigkeit von M n0 bas = Anzahl der Basissequenzen in M n0 bas- 
Anzahl pro Verfahrenszyklus zu konstruierender Sequenzen. 
Anzahl insgesamt in alien Verfahrenszykien hergestellter Sequenzen. 
maximale Anzahl pro Verfahrenszyklus konstruierbarer Sequenzen. 
Homologie. Ein MaB fur die Obereinstimmung zwischen zwei Sequenzen. 
Es gilt: 0 <= h <= 1. 

Schmelztemperatur. Fur eine DNA-Sequenz wird die Schmelztemperatur nach 
dem Nearest Neighbour Verfahren (siehe Breslauer, K.J., Frank, R., Blocker, 
H., Marky, L.A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989) bestimmt: 
t m = AH / (AS + R x ln(C/4)) - 273,1 5°C 

Dabei sind AH und AS Enthalpie und Entropie der DNA-Helix, R die molare 
Gaskonstante und C die Konzentration der DNA-Sequenz. 
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Das Herstellungverfahren erfolgt als ein Abfolge beliebigT jedoch endlich vieler 
Verfahrenszyklen, in denen n 10t Sequenzen konstruiert werden, und einer nachfolgenden 
Synthese, in der alle n, 0 , Sequenzen in vitro erzeugt werden. 

Die maximale Anzahl nmax der pro Verfahrenszyklus konstruierbaren Sequenzen errechnet 

sich entsprechend den oben gegebenen Definitionen nach 

rw =/(a, L, W := L( V4 * ( (a lbas ) - (a ,ba ^) - |M TObas |) ) / (| seq - W J . 

D.h. es lassen sich maximal n max Sequenzen der Lange l sep aus Elementen eines Alphabetes 

A der GroBe a (im Falle von DNA ist a = 4) konstruieren, die in maximal l ov 

zusammenhangenden Ketten von Monomeren ubereinstimmen. Die Anzahl der tatsachlich 

pro Verfahrenszyklus erhaltenen Sequenzen kann geringer sein, wenn diese bestimmte 

physikalische, chemische Oder strukturelle Eigenschaften aufweisen sollen, oder wenn 

zusatzlich zu bereits vorhandenen Sequenzen weitere Sequenzen hergestellt werden. 

Im Einzelnen sind folgende Verfahrensschritte notig: 

1 Es werden n tol Sequenzen in z Verfahrenszyklen konstruiert und in einer Menge WU, 
gesammelt. Man beginnt mit der leeren Sequenzmenge M seq . 

2 Zur Sequenzmenge M seq konnen einmalig, vor Beginn des Verfahrenszyklus, beliebige, 
jedoch eindeutige, Sequenzen hinzugefugt werden. Dies kann nutzlich sein, urn 
bestimmte Sequenzen hinzuzufugen, die aus Grunden der weiteren Anwendung in der 
Menge der hergestellten Monomersequenzen enthalten sein sollen. Es empfiehlt sich 
dabei, nicht zu viele und nicht zu lange Sequenzen hinzuzufugen, da das Verfahren fur 
diese Sequenzen nicht dieselben Eigenschaften garantiert wie fur die im Folgenden 
konstruierten Sequenzen. 

3 Beginn des Verfahrenszyklus: Es werden die strukturellen, chemischen und 
physikaiischen Eigenschaften festgelegt, die die herzustellenden Sequenzen erfullen 
mussen. Strukturelle Eigenschaften sind zumindest das Enthaltensein oder Nicht- 
Enthaltensein bestimmter Teilsequenzen (ggfs. auch die Positionen, an denen die 
Teilsequenzen in den zu erzeugenden Sequenzen enthalten oder nicht enthalten sein 
sollen) und das Verhaltnis der Anzahl der verschiedenen Monomere zueinander (im Falle 
von DNA: Verhaltnis GC/AT). Chemische Eigenschaften sind mindestens das 
Vorkommen bestimmter Teilsequenzen, die EinfluB auf die chemische Wechselwirkung 
mit eigenen oder anderen Substanzen haben (im Falle von DNA z.B. bestimmte 
Proteinbindungsstellen, Restriktionsschnittstellen wie z.B. 5gatatc3' fur EcoRV, die 
Stopcodons 5'tca3\ 5'tta3', 5'cta3' usw.). Zu den festzulegenden physikaiischen 
Eigenschaften zahlt zumindest die Schmelztemperatur t m der herzustellenden 
Sequenzen. 
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4 Es werden jetzt die Anzahl der pro Zyklus gewunschten Sequenzen n <= n maXl nach 
obiger Formel l se q der zu konstruierenden Sequenzen und l b as der zur Konstruktion 
benotigten Basissequenzen festgelegt. I seq und l^s werden nach der oben angegebenen 
Formel so gewahlt, daB die gewunschte Anzahl n zu konstruierender Sequenzen erreicht 

5 werden kann. Da l bas /lseq proportional zur Fehlhybridisierungswahrscheinlichkeit ist, 

werden l bas und l seq so gewahlt, daB das Verhaltnis l b as/lseq moglichst gering ist (Werte 
unter 0,3 sind empfehlenswert) und Werte fur l seq gute Hybridisierungsbedingungen 
garantieren. Fur DNA sind temperaturabhangig beliebige Werte fur 1^ > 0 moglich. 

5 Es wird die Menge Mba S aller Sequenzen des Alphabetes A der Lange I bas erzeugt. Die 
10 solcherart erzeugten Sequenzen werden als Basissequenzen bezeichnet. Es gibt dabei 

immer a ,bas Basissequenzen. Diese Basissequenzen dienen der Konstruktion der 
herzustellenden Sequenzen. Jede Basissequenz bekommt einen Status „benutzt" Oder 
„unbenutzt" zugewiesen. Es werden zunachst alle als unbenutzt markiert. 

6 Selbst-komplementare Basissequenzen aus M bas werden nun als benutzt markiert. Dabei 
15 gibt es genau a lbas/2 zu sich selbst komplementare Basissequenzen. 

7 Soliten bereits Sequenzen in der Menge M seq vorhanden sein, so konnen entweder dazu 
kompatible neue Sequenzen konstruiert werden oder die Sequenzen einer Teilmenge 
von kompatibel verlangert werden. Dazu wird innerhalb eines 
Dekompositionsverfahrens aus den bereits vorhandenen Sequenzen aus M seq eine 

20 Menge Mno bas aller Teilsequenzen der in Schritt 4 vorgegebenen Lange l ba s der 

Sequenzen aus M seq gebildet: 

SetZe Mnobas = {}• 

Jede Sequenz S se q aus M seq wird nun in (l seq - l ov ) Dekompositionsschritten zerlegt: 
Beginne mit i = 0 mit dem Dekompositionsschritt: 
25 Solange i < (l seq - l w ): 

Bilde als neue Sequenz Sne U als Sequenz der Lange l bas bestehend aus den 
Monomeren S seq ,i bis S S eq,i+iba S : S ne u := S seq ,j S se q f i + i b as. 
Fuge Sneu der Menge Mno ba s hinzu. 
Setze i := i + 1 . 

30 Die auf diese Weise erhaltene Menge Mno bas ist definitionsgemaB eine Teilmenge von 

Mfaas- 

8 Alle Basissequenzen der Menge M^, die auch in M n0 bas vorkommen, werden als benutzt 
markiert, so daB fur die Konstruktion von Sequenzen genau (a lbas - a lbas/2 . |Mnobas|) 
unbenutzte Basissequenzen ubrig bleiben, aus denen nun maximal 

35 f ((^^ )-(a /to/2 )-lM n ^l) ^ 
2 i 
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verschiedene neue Sequenzen konstruiert werden konnen, die untereinander und zu den 
bereits vorhandenen Sequenzen keine Basissequenzen bzw. deren Komplemente 
gemeinsam haben. 

Aus den Basissequenzen wird ein gerichteter Graph konstruiert, dessen Knoten 
bestimmte Basissequenzen reprasentieren: Der Graph enthalt genau a ,bas Knoten, von 
denen bereits (a ,Das/2 + |Mnobas|) Knoten als benutzt markiert sind. Jeder Knoten ist mit 
einer Basissequenz S b(i) assoziiert, die nicht zu sich selbst komplementar ist (im weiteren 
wird es keine Unterscheidung von Knoten und assoziierter Basissequenz geben). 
Es existiert eine Kante von S b( i) nach S b(k)) wenn die J ov letzten Buchstaben von S b <i) den 
iov ersten Buchstaben von S b(k) entsprechen, wenn also gilt: 

S b (j),2 , Sb(i).fbas = S b (k),i, •■■» S b (k},| b as-1 ■ 

Der Knoten S b(k} wird Nachfolgeknoten von S b(i) genannt. 

Der Knoten, der mit dem Komplement der Basissequenz assoziiert ist, die durch den 
Knoten S b (i> kodiert wird, wird Komplementknoten zu Knoten S b(i) genannt. 
Sequenzen der Lange l seq werden gefunden, indem ein Pfad mit (l seq - l ov ) Knoten gesucht 
wird. Jeder Knoten darf maximal einmal benutzt werden. AuBerdem darf fur jeden 
Knoten, der in einem der Pfade liegt, der Komplementknoten in keinem Pfad 
vorkommen. Der Anfangsknoten des Pfades tragt wie die Sequenz einen Status 
„benutzt w bzw. „unbenutzt". 

Aus dem Graphen konstruiert man Sequenzen nach folgendem Verfahren: 

Kennzeichne alle unbenutzten Knoten des Graphen als unbenutzte Anfangsknoten. 
Fur jedes s zwischen 1 und n: 



Solange Knoten S b(k) existiert, der noch nicht als benutzter Anfangsknoten 
markiert ist: 

Wahle einen unbenutzten Knoten S b(k) aus. 

Markiere Knoten S b(k) als benutzten Anfangsknoten; auGerdem: 

Markiere Sequenz S b(k} und sein Komplement als benutzt. 

Nun wird eine neue Sequenz Sneu konstruiert, die neues Element fur M seq ist 

Oder eine bestehenden Sequenz S sub aus M seq verlangert: 

Setze Sneu^ := S b ( k ),i. 

Falls sie als neue Sequenz konstruiert wird, setze i := 0. 

Falls sie als Verlangerung einer bereits bestehenden Sequenz S sub konstruiert 

wird, setze i := l sub . 

Solange i < l seq - (l ov -1) und i >= 0 gilt: 

Existiert kein unbenutzter Nachfolgeknoten S b (m) von Knoten S b(k) , so 
markiere Knoten S b(k) und dessen Komplementknoten als unbenutzt und 
setze i := 

Sonst wahle per Zufall einen unbenutzten Nachfolgeknoten S b(m) von Knoten 
S b(k) aus und markiere b m und dessen Komplementknoten als benutzt. Setze 
zusatzlich: i := i+1 ,k:=m, S ne u,i := S b(m) , 
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Wenn i = l seq - (U-1) ist, ist die Sequenz Sneu fertig: sie besteht aus den 

BUChStaben Sneu.O biS Sneu,(lseq - lov)- 

11 Zu jeder der in Schritt 10 erhaitenen Sequenzen werden die jeweiiigen 
strukturellen, chemischen und physikalischen Eigenschaften im Vergteich zu 

5 den in Schritt 3 festgelegten Bedingungen ermittelt. Genugt die jeweilige 

Sequenz nicht den vorgegebenen Bedingungen, so wird sie geloscht und die 
von ihr benutzten Knoten und Kompiementknoten wieder als unbenutzt 
markiert. 

12 Wenn die Anzahl der konstruierten Sequenzen nicht ausreicht, kann der 
10 Verfahrenszyklus von Schritt 3 Oder 4 an beiiebig oft wiederholt werden. Insbesondere ist 

es moglich, die strukturellen, chemischen und physikalischen Kriterien und die Werte fur 
n, l S eq, Ibas pro Verfahrenszyklus jeweils neu zu setzen. So ist es moglich, Sequenzen mit 
unterschiedlichen strukturellen, chemischen und physikalischen Eigenschaften, sowie 
unterschiedlicher Lange zu konstruieren, die trotzdem kompatibel, also eindeutig und 
1 5 maximal unahnlich sind. 

Ansonsten geht man zum nachsten Schritt, der in vitro Synthese. 

13 Die konstruierten Sequenzen werden in vitro, im Falle von Nukleinsauren vorzugsweise 
mittels eines Oligonukleotidsynthezisers (z.B. ABI 392, ABI 398, ABi 3948 von Perkin- 
Elmer Applied Biosystems), synthetisiert. Dazu werden die Sequenzdaten der 

20 Steuerungseinheit des Oligonukleotidsynthesizers ubermittelt und die Sequenzen als 

einzelstrangige Nukleinsauren hergestellt. Die Sequenzen konnen auch kommerziell 
bestellt werden. ZweckmaBig sind PAGE-gereinigte Oligonukleotide (z.B. von ARK 
Scientific GmbH Biosystems, 64293 Darmstadt, erhaltlich). 



25 Um Grammatiken in Moiekule ubersetzen zu konnen muB das oben erwahnte Problem der 
Uniqueness-Verletzung bei der Verknupfung von Sequenzen gelost werden (siehe Abbildung 
21). Dieses Problem ist mit dem Niehaus-Verfahren nicht zu behandein, da dort keine 
Verknupfung von Sequenzen vorgesehen ist. Im Einzelnen ist das Niehaus-Verfahren fur die 
Losung folgenderTeilprobleme nicht machtig genug: 

30 - Die Verknupfung von Sequenzen kann zu einer Uniqueness-Verletzung fuhren (siehe 
Abbildung 21). 

Bei der Verknupfung von Variablen und Terminalen kann die Sequenz einer Variable je 
nach Grammatik in mehr als eine Terminalsequenz pro Ende ubergehen und umgekehrt 
(siehe Abbildung 22 und Abbildung 24). 
35 - Bei der Verknupfung z.B. mehrerer Terminalen mit der selben Variable kann es zu 
Uniqueness-Verletzungen kommen, die sich durch einfache Pfadsuche nicht auflosen 
lassen (siehe Abbildung 23). 



Das Problem wird mit einer als "Parallel-Extension" bezeichneten Strategie unter Verwendung 
40 des NFR-Verfahrens gelost. Dabei wird im Einzelnen foigendermaBen vorgegangen 
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(beispielhaft gezeigt fur die Konstruktion von Variablen zu vorgegebenen Terminaien, siehe 
auch Abbildung 22 bis Abbildung 24): 

1 . Eine Gruppe von Sequenzen (hier: die Terminate, z.B. Sequenzen zur Representation von 
Bits oder Sequenzen mit bestimmten chernischen oder bioiogischen Eigenschaften) seien 

5 vorgegeben. 

2. Sammie fur jede Variable alle Paare von Terminaien, deren Sequenzen die jeweilige 
Variablensequenz im Logomer einrahmen werden und fasse sie zu Gruppen zusammen, 
eine Gruppe fur jede Variable (siehe Abbildung 22 und Abbildung 24). Ordne die Pfade 
der Terminalpaare so an, daf3 zwischen jedem Paar eine Lucke bleibt, deren Lange der 

10 Variablenpfadlange (l seq - Ibas + 1) pius jeweils l bas - 1 Knoten fur jeden der beiden 

Ubergange entspricht. Dabei ist ein Ubergang derjenige Pfad der Lange Ibas - 1. der 
jeweils zusammengehdrende Terminale und Variablen miteinander verbindet. In 
Abbildung 21 besteht dieser z.B. aus den markierten Basissequenzen. Ubergange konnen 
zusammenlaufen (z.B. die Terminale a, b, c zur Variable A in Abbildung 22) oder sich 

15 verzweigen (z.B. die Variable A zu den Terminaien b, c, d in Abbildung 22). 

3. Wahle die jeweils letzte Basissequenz jeder Terminalsequenz auf der linken Seite als 
Startknoten fur den jeweiligen Pfad (siehe Abbildung 24). 

4. Erzeuge die Terminal-Variable-Obergange simultan, d.h. suche in jedem Iterationsschritt 
fur aile Pfade je einen Nachfolgeknoten, dessen letztes Monomer fur alle Pfade einer 

20 Gruppe das selbe ist. Kann in diesem Schritt kein unbenutzter und erlaubter Knoten 

gefunden werden, so wird Backtracking ausgelost. Ist dieses nicht moglich, so scheitert 
die Ubersetzung einer Grammatik in Algomere an diesem Punkt und die Ubersetzung 
muf3 mit veranderten (vorzugsweise weniger restriktiven) Parametern wiederholt werden. 
Zulassig ist dagegen die mehrfache Verwendung eines Knotens in einem Iterationsschritt 

25 fur die jeweils zusammengehorenden Ubergange (siehe Abbildung 23 und Abbildung 24). 

5. Erzeuge die Variablen-Sequenzen ebenfalls simultan als Verlangerung der Obergange. 

6. Erzeuge die Variable-Terminai-Ubergange analog wie unter 4 beschrieben. Hierbei sind 
die Nachfolger jedoch nicht frei wahlbar, sondern durch die l bas - 1 ersten Nukleotide der 
rechten Terminalsequenz vorgegeben. Die Pfadsuche folgt hier dieser Vorgabe urn 

30 festzustellen, ob die Pfade sich vervollstandigen lassen. 

Durch das als "Parallel-Extension" bezeichnete Verfahren wird es moglich, eine Schnittstelle 
zwischen Computer und den in-vitro ausgefuhrten Schritten, beginnend mit der 
Synthetisierung von Oligonukleotiden, zu schaffen und die Schritte von Definition von 
Grammatiken bis zur Herstellung von Molekulen in-vitro vollstandig zu automatisieren. 

35 
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Erlauterung zu III: Implementierung regularer Grammatiken mit dem NFR-Verfahren 

Die Herstellung von Monomersequenzen zur Darstellung der Regelmenge von Grammatiken 
in Schritt III des erfindungsgemaBen Verfahrens erfoigt mit Hilfe des NFR-Verfahrens 

5 (Niehaus-Feidkamp-Rauhe-Verfahren) nach Schritt II des erfindungsgemaBen Verfahrens. 
Zur Implementierung von Grammatiken werden nach dem NFR-Verfahren fur r Regeln einer 
Grammatik G genau 2r Monomersequenzen hergestellt, so daB die Monomersequenzen fur 
die s dargestellten Symbole (Terminale und Variablen) und die Regeln R der Grammatik G 
eindeutig und zueinander moglichst unahnlich sind, sowie die geforderten strukturellen, 
10 chemischen und physikalischen Eigenschaften aufweisen. 

Die Monomersequenzen werden dazu nach dem NFR-Verfahren so hergestellt, daB sie wie 
im Folgenden beschrieben zu Algomeren zusammengesetzt werden konnen. Es werden dabei 
jeweils 2 Monomersequenzen zu einem Aigomer zusammengesetzt, das genau eine Regel R 
einer Grammatik G reprasentiert. Dabei enthalten beide Monomersequenzen jeweils 

15 Sequenzen, die die nach der Regel R erforderiichen zusammengehorenden Symbole 
(Terminale oder Variablen) enthalten. 

Der Entwurf der Oligomere nach Schritt III des erfindungsgemaBen Verfahrens ist abhangig 
von der chemischen Natur der eingesetzten Monomere. Im bevorzugten Fall der aus 
Nukleotiden aufgebauten Oligomere wird folgendermaBen vorgegangen: 
20 Algomere sind doppelstrangig und haben einen 5'-Strang (Oberstrang) und einen ^-Strang 
(Unterstrang). Oberstrang und Unterstrang konnen die Verknupfung jeweils einer Terminal- 
und einer Variablensequenz sein. 

Es seien X, Z beliebige Variablen, S eine Variable, die als Startsymbol fungiert, y, z beliebige 
Terminalsymbole. Dann wird fur jede Regel der Form: 
25 a) S := yX 

ein Aigomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz y enthalt, an die 
am 3'-Ende eine eindeutige einzelstrangige Uberhangsequenz X angehangt ist; ":=" bedeutet 
in diesem Fall, daB S und yX identisch sind, d.h. yX als Startermolekul fungiert. 

b) X->yZ 

30 ein Aigomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz y enthalt, an die 
am 5'-Ende eine eindeutige einzelstrangige Uberhangsequenz X und am 3'-Ende eine 
eindeutige einzelstrangige Uberhangsequenz Z angehangt ist. X kann dabei identisch mit Z 
sein. 

c) X->z 

35 ein Aigomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz z enthalt, an die 
am 5'-Ende eine eindeutige einzelstrangige Oberhangsequenz X angehangt ist. 
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Algomere der Form S := yX und X -> z heiBen Terminatoren ("Start", "Ende"), da sie zum 
Kettenabbruch wahrend der Polymerisation im erfindungsgemaBen Verknupfungsschritt V 
fuhren, der im Folgenden beschrieben wird; Algomere der Form X -> yZ heiBen Elongatoren, 
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weil sie zu einer Kettenverlangerung wahrend der Polymerisation im erfindungsgemaBen 
Verknupfungsschritt V fuhren. 

Vorzugsweise umfassen die in den Schritten II und III des erfindungsgemaBen Verfahrens 
hergestellten Monomersequenzen Nukleotide, insbesondere Ribonukleotide, besonders 
bevorzugt Desoxyribonukleotide. Die in Schritt II des erfindungsgemaBen Verfahrens 
konstruierten Monomersequenzen konnen vorteilhafterweise bestimmte Sequenzen, z.B. 
Stopcodons, Erkennungssequenzen fur Nukleinsauren spaltende Enzyme 

(Restriktionsnukleasen), Erkennungssequenzen fur Nukleinsaure-bindende Proteine u.a. 
enthalten, wie sie beispielsweise in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular 
Cloning, A Laboratory Manual, (1989)], [Rolf Knippers, Molekulare Genetik, Georg Thieme 
Verlag, (1997)] und [Benjamin Lewin, Genes V, Oxford University Press, (1994)] beschrieben 
werden. 



5 Erlauterung zu IV: Algomer-Assemblierung 



Das Assemblieren der in Schritt III synthetisierten Sequenzen erfolgt in Schritt IV des 
erfindungsgemaBen Verfahrens. Im Rahmen der vorliegenden Erfindung sind zur 
Durchfuhrung des Schrittes IV alle dem Fachmann bekannten Techniken, 
Oligomersequenzen zusammenzusetzen, einsetzbar. Im erfindungsgemaB bevorzugten Fall 
des Einsatzes von Nukleotidsequenzen ist es zweckmaBig folgendermaBen vorzugehen: 

a) Die zu Elongatoren gehorenden einzelstrangigen Sequenzen werden phosphoryliert. Dazu 
sind verschiedene dem Fachmann bekannte Protokolle moglich, z.B. das Folgende: 

In einem 20//I Ansatz werden 16//I einer synthetisierten 100//M Sequenz, 2//I Ligationspuffer 
(z. B. 50 mM Tris-HCI pH 7.5, 10 mM MgCI 2> 10 mM Dithiothreitol, 1 mM ATP, 25//g/ml BSA 
Bovine Serum Albumin, New England Biolabs) und 2//I PNK (Polynukleotidkinase, z.B. von 
New England Biolabs, Katalognr. #201 S Oder #201 L) 1 Stunde bei 37°C inkubiert. Volumina, 
Inkubationszeit und -temperatur konnen in dem Fachmann bekannter Weise variiert werden. 

b) Jeweils in einem Ansatz werden die zu einem Algomer gehorenden EinzelstrSnge (Ober- 
und Unterstrang) zu einem fertigen Algomer hybridisiert. Fur Elongatoren konnen einfach die 
Phosphorylierungsansatze von Ober- und Unterstrang verwendet werden. Fur die 
Hybridisierung sind mehrere Protokolle moglich; bevorzugt ist ein Denaturierungsschritt bei 
etwa 95°C zu Anfang (dieser deaktiviert gleichzeitig die PNK in den Ansatzen der 
Elongatoren) und eine langsame Hybridisierung. Z.B. kann fur Oligomere der Lange 30 
folgendes Protokoll verwendet werden, das gemaB den Kenntnissen des Fachmanns variiert 
werden kann: 

In einem 40//I Ansatz werden jeweils 20//I des Oberstranges (100//M) und 20//I des 
Unterstranges (100//M) in einem Thermozykler 5 Minuten auf 95°C erhitzt, 5 Minuten auf 72°C 
inkubiert und dann 25 Minuten jeweils 1°C pro Minute abgekuhlt. 
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Erlauterung zu V: Herstellung von Logomeren durch Verkettung von Algomeren: 
Symbolpolymerisation 

In Schritt V des erfindungsgemaBen Verfahrens werden die Algomere zu langerkettigen, 
5 informationstragenden Poiymeren (Logomeren) verknupft. Da Algomere die Regelmenge R 
einer Grammatik G darstellen, entsprechen alle dabei erzeugten Logomere Wortern der 
Sprache L(G), die durch die Grammatik G beschrieben wird. 

Der geregelte ProzeB der Verkettung von Algomeren zu Logomeren wird ais 
„Symboipolymerisation" bezeichnet, im Falle, daB die Terminalsymbole Bits reprasentieren, 
10 das heiBt, im Falle, daB gilt: 

SL:= {0, 1, so, s^ s 2 , s^, s n , e 0 , e 1t e 2 e m . lT e m } mit n, m e IN und n, m > 0, 

wird der ProzeB als „Bitpolymerisation tt bezeichnet. 

Im Rahmen der vorliegenden Erfindung sind zur Durchfuhrung des Schrittes V alie dem 
15 Fachmann bekannten Techniken, Oligomere zu Poiymeren zu verknupfen, einsetzbar. Im 
erfindungsgemaB bevorzugten Fall des Einsatzes von Oligonukleotiden ist es zweckmaBig, 
die zu verkniipfenden Algomere in Gegenwarl von Ligase zu inkubieren. Beispielsweise kann 
nach folgendem Protokoll vorgegangen werden, das gemaB den Kenntnissen des Fachmanns 
variiert werden kann: 

20 In einem 27/vl Ansatz werden 1jwl 50//M "StarT-Afgomer, 1//I 50/yM "Ende"-Algomer und 2x 
jeweils 10/yi 40//M Elongator-Algomere (aus Schritt IV des erfindungsgemaBen Verfahrens 
erhalten), 1 f 5/yl 10mM rATP und 3,5jl/I T4 DNA Ligase mit 400 NEB Units/jul (z.B. Katalognr. 
#202S und #202L NEB) zwischen 4°C und 25°C fur 2 bis 24Stunden inkubiert. 
Andere Reaktionsvolumina funktionieren analog. Inkubationszeit und -temperatur konnen in 

25 dem Fachmann bekannter Weise variiert werden. 

Abbildung 3 zeigt das Resultat einer solchen Symbolpolymerisation. 

Es konnen dabei grundsatzlich beliebig vieie Algomere, die keine Terminatoren sind, 
verknupft werden. Der Polymerisationsvorgang kommt fur jedes einzelne Logomer dann zu 
einem Stiilstand, wenn das entsprechende Molekui an seinen Enden jeweils ein Algomer tragt, 
30 das als Terminatormolekul ("Start", "Ende") f ungiert. 



Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung 

35 Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Isolierung und 
Vervielfaltigung von informationstragenden Poiymeren, die nach einem der vorhergehenden 
Anspruche erhalten wurden, das dadurch gekennzeichnet ist, daB man in Schritt V erhaltene 
informationstragende Polymere in Klonierungsvektoren ligiert, kompetente Zellen mit diesen 
Vektoren transformiert und die erfolgreich transformierten Bakterien anhand von 

40 Selektionsmarkern selektioniert. 



10 
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Die aus Schritt V des oben beschriebenen erfindungsgemaBen Verfahrens 
{Symbolpolymerisation) erhaltenen Logomere konnen zum Zwecke der Vereinzelung und 
Vervielfaltigung kloniert werden. 

Dazu wird der verwendete Klonierungsvektor mit Restriktionsenzymen aufgeschnitten und ein 
Logomer hineinligiert. Das Verfahren stellt sicher, daB nur fertig polymerisierte (mit 
Terminatoren versehene) Logomere mit dem Zielvektor ligiert werden konnen. Korrekt in den 
Zielvektor ligierte Logomere bilden ein wieder ringformiges Molekui. Die Vereinzelung von 
Logomeren erfolgt durch die Transformation von Bakterien mit dem Molekulgemisch, das das 
Resultat der Ligation ist. Die Vektoren tragen Selektionsmarker (vorzugsweise Antibiotika- 
Resistenz z.B. Ampicillin-Resistenz), mit denen erfolgreich transform ierte Bakterien 
ausgewahlt werden konnen. Da jedes Bakterium nur ein Plasmid exprimiert, ist jedes 
erfolgreich transformierte Bakterium Trager genau eines Logomers. Solcherart klonierte 
Logomere konnen dann zur weiteren Verwendung einfach und in groBen Mengen (auf Fest- 
oder in Flussigmedium, Fermentern) vervielfaltigt werden. 

15 

Die aus Schritt V des erfindungsgemaBen Verfahrens erhaltenen Logomere werden zum 
Zwecke der Vereinzelung und Vervielfaltigung in einem beliebigen Klonierungsvektor 
(Plasmid) kloniert, der Restriktionsschnittstellen tragt, die zu den Sequenzuberhangen der 
Terminatoren der Logomere kompatibel sind (z.B. Hindlll, BamHI Erkennungssequenzen im 

20 Klonierungsvektor pBluescript I) KS +/-, Stratagene, Katalog Nr. #212207). Die Klonierung 
erfolgt nach ublichen Laborprotokollen, wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, 
Molecular Cloning, A Laboratory Manual, (1989)] beschrieben. Z.B. kann folgendes Protokoil 
verwendet werden, das gemaB den Kenntnissen des Fachmanns variiert werden kann: 
a) Restriktion und Preparation des Klonierungsvektors 

25 Zur Klonierung konnen beliebige Klonierungsvektoren verwendet werden, wie sie fur 
molekularbiologische Verfahren ublich sind. (Geeignet ist z.B. das Plasmid pBluescript II KS 
+/-, Stratagene, Katalog Nr. #212207). Das Plasmid wird einem Restriktionsverdau mit zwei 
Restriktionsenzymen unterworfen, die Uberhange erzeugen, die zu den Terminatoren der 
Logomere kompatibel sind. Als Restriktionsenzyme konnen z.B. BamHI und Hindlll (z.B. von 

30 NEB, New England Biolabs, Katalog Nr.: #136S und #104S) verwendet werden. Dazu kann 
ein ubliches Restriktionsprotokoll verwendet werden, das gemaB den Kenntnissen des 
Fachmanns variiert werden kann, z.B. das Foigende: 

In einem 50//I Ansatz werden 30//I Plasmid (0,7//g///l), 5p\ 10x Puffer (z.B. NEB2, New 

England Biolabs), 5jj\ BamHI (100 units), 5jj\ Hindlll (100 units) und 5//I BSA 10x fur 1-2 
35 Stunden bei 37°C inkubiert. Zur Kontrolle wird 1//I des Ansatzes, sowie eine entsprechende 

Menge ungeschnittenes Plasmid auf einem 1% Agarose Gel (z.B. UltraPure™ von Gibco 

BRL, Life Technologies, Katalog Nr.: 15510-027) elektrophoretisch aufgetrennt. 

Zur Praparation der DNA wird der Restriktionsansatz phenolisiert, die DNA gefallt und 

wiederaufgenommen: 
40 - Ansatz auf 200//I mit Aqua dest. auffullen 

- 200//I Phenol zugeben, vortexen, bei 10000g 3 Minuten zentrifugieren 
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Uberstand aufnehmen und 200/vl Chloroform zugeben, vortexen, bei 10000g 3 Minuten 
zentrifugieren 

Uberstand aufnehmen, mit 1/10 Vol. 3M NaAc ansauern und mit 2 f 5x Volumen 100% 
EtOH versetzen, vortexen, fur mindestens 15 Minuten auf -70°C 
5 - mindestens 15 Minuten auf 10000g zentrifugieren, Uberstand abnehmen und verwerfen 

mit ca. 500p\ 70% EtOH waschen, fur 5-10 Minuten auf 10000g zentrifugieren, Uberstand 
abnehmen und verwerfen 

Pellet trocknen und in Aqua dest. wiederaufnehmen, so daB das geschnittene Plasmid mit 
100ng///l bis 1//g///! vorliegt (hohere Konzentrationen sind auch moglich). Plasmid kann fur 
10 weitere Ligationen notigenfalls verdunnt werden. 

b) Ligation des Logomers in den Klonierungsvektor 

Die in Schritt V des erfindungsgemaBen Verfahrens erhaltenen Logomere und die 
praparierten Klonierungsvektoren werden ligiert. Durch die Art und Weise der Preparation ist 

15 gewahrleistet, daB moglichst nur die gewunschten Ligationen stattfinden: Die Terminatoren 
der Logomere tragen zwei verschiedene Uberhangsequenzen, die zu den durch Restriktion 
entstandenen Uberhangsequenzen des Klonierungsvektors kompatibel sind. Dadurch konnen 
die Logomere nur in einer definierten Richtung in den Klonierungsvektor ligieren. AuBerdem 
sind die Terminatoren der Logomere nicht phosphoryliert, weshalb Logomere ausschlieBlich 

20 mit den Uberhangsequenzen des Klonierungsvektors ligieren konnen. Die Ligation erfolgt 
nach einem ublichen Ligationsprotokoll wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, 
Molecular Cloning, A Laboratory Manual, (1989)] beschrieben, das gemaB den Kenntnissen 
des Fachmanns variiert werden kann, beispielsweise wie folgt: 

Das molare Verhaltnis Logomere/Klonierungsvektor kann z.B. 500 betragen, in 10//! 
25 Gesamtvolumen werden: 

1 fj\ Plasmid (10ng///l = 5nM) 

0,5 fj\ 4//M Logomere aus Schritt V des erfindungsgemaBen Verfahrens 
1 jj\ 10x Ligationspuffer 
0,5 fj\ T4 DNA Ligase (400u//yl) 
30 7//i H 2 0 

fur 12 Stunden auf 16°C ligiert. 

Das Protokoll kann gemaB den Kenntnissen des Fachmanns variiert werden. Z.B. ist es 
moglich, ein Protokoll zurTCL (Temperature Cycle Ligation, [Lund, A.H., Duch, M., Pedersen, 
F.S, Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: 
35 (4), 800-801 , (1 996)]) zu verwenden. 

Der erhaltene Ligationsansatz wird nun fur die Transformation kompetenter Zeilen verwendet, 
wie nachfolgend beispielhaft gezeigt: 

c) Transformation kompetenter Zellen 

Die Transformation von Bakterien (kompetente Zellen, Hoststamm z.B. dH5a, GIBCO BRL, 
40 Katalog Nr.: 18258-012) mit dem Ligationsansatz aus b) erfolgt nach einem der ublichen 
Protokolle, wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A 
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Laboratory Manual, (1989)] beschrieben wird und das gemaB den Kenntnissen des 
Fachmanns variiert werden kann, z.B. wie folgt: 

200y\ kompetenter Zellen (~ 5x1 0 7 CFU = Colony Forming Units, bei -70°C gelagert) 

werden aufgetaut und auf Eis gestellt 
5 - Etwa 1ng des Ligationsansatzes aus b) wird dazu pipettiert und 20-30 Minuten auf Eis 

stehen geiassen, alle 5 Minuten vorsichtig mixen 

Hitzeschock: Ansatz 2 Minuten aut 42°C, zuruck auf Eis 
- 0,8ml LB-Medium (+ 0,02M MgS0 4 + 0,01 M KCI) zugeben 

Ansatz 20-60 Minuten im Reagenzglas auf 37°C rollen 
10 - 0,1 - 1 ml auf Agarplatte (mit Antibiotikum, z.B. Ampicillin) ausplattieren und Uber Nacht 

auf 37°C 

Die Transformation fungiert dabei als Selektionsverfahren auf erfoigreich klonierte Logomere 
und als Isolationsverfahren einzelner Logomere, weil jede Bakterienzelle genau ein Piasmid 
exprimiert. 

15 

AuBer dem genannten Verfahren der Klonierung, das erfindungsgemaB bevorzugt ist, konnen 
die in Schritt V des erfindungsgemaBen Verfahrens erhaltenen informationstragenden 
Polymere (Logomere) mit folgenden Verfahren isoliert und vervielfaltigt werden: 

20 Isolation durch Hybridisierung und chromatographische Methoden 

Hierbei wird das aus einer Symbolpolymerisation erhaltene Molekulgemisch uber ein 
Tragermaterial gegeben, an das Oligomere ("Ankersequenzen") gebunden sind, die ihrerseits 
an die Terminatoren der Logomere binden konnen. Die gebundenen Logomere werden dann 
einzeln aufgenommen und konnen nach Bedarf vervielfaltigt werden. 

25 Es sind hierzu verschiedene Verfahren einsetzbar: 

a) Affinitatschromatographie; dabei werden Ankersequenzen, die zu den uberhangenden 
Enden der Terminatoren kompatible Enden besitzen, z.B. an eine Hydroxylapatit-Saule 
gebunden. Die aus Schritt V des erfindungsgemaBen Verfahrens erhaltenen Logomere 
werden uber die Saule gegeben, wodurch die Logomere durch Hybridisierung an die 

30 Ankersequenzen binden konnen. Die soicherart gebundenen Logomere werden dann 

einzeln aufgenommen. 

b) Ankersequenzen werden an eine Membran (z.B. Gene Screen Plus, DuPont, 
Biotechnology Systems; Hybond-N, Amersham Life Sciences) kovalent gebunden. Die 
Membran ist gerastert, d.h. in einzeine Felder unterteilt. Pro Feld wird genau eine 

35 Ankersequenz kovalent an die Membran gebunden. Danach werden die aus Schritt V des 

erfindungsgemaBen Verfahrens erhaltenen Logomere uber die Membran gegeben und 
mit den Ankersequenzen hybridisiert. Die Membran wird daraufhin in die einzelnen Felder 
des Rasters zerschnitten. Die einzelnen Felder, die nun maximal ein an die jeweilige 
Ankersequenz gebundenes Logomer enthalten, konnen jetzt in separate GefaBe (z.B. 

40 Eppendorf Tubes) uberfuhrt werden. Sodann konnen die Logomere durch Denaturieren 

von der Membran getrennt werden. Beim Denaturieren ist zu beachten, daB die 
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Denaturierungstemperatur so gewahlt ist, daB sie hoch genug ist, um Logomer und 
Ankersequenz zu trennen, jedoch nicht so hoch, daB das Logomer selbst vollstandig 
aufschmilzt. 



5 Isolation durch Verdunnung 

Bei der Isolation durch Verdunnung werden die Logomere, die als Gemisch aus einer 
Symbolpolymerisation erhalten werden, soweit verdunnt, daB in einem jeweiligen Zielvolumen 
statistisch genau ein Molekul enthalten ist. Dieses kann dann mit Hilfe der PCR aufgespurt 
und vervielfaltigt werden. Die Verdunnung des Ausgangsvolumens in Zielvolumina kann dabei 
10 gleichzeitig geschehen, so daB ein Ausgangsvolumen auf n Zielvolumina verdunnt wird. 
Dazu wird erfindungsgemaB wie foigt vorgegangen: 

Zu einem, aus Schritt V des erfindungsgemaBen Verfahrens erhaltenen, Gemisch von 
Logomeren in einem Ausgangsvolumen V a wird ein Verdunnungsfaktor ermittelt, der n in V a 
enthaltene Logomere so auf n Zielvolumina V 2 verdunnt, daB in jedem Zielvolumen V 2 

15 statistisch genau ein Logomer enthalten ist. Um den Verdunnungsfaktor zu ermitteln wird ein 
Aliquot des Ausgangsvolumens (z.B. 1//I) in einer Verdunnungsreihe austitriert. Von jeder 
Verdunnung der Reihe wird dann ein Aliquot (z.B. 1//I) als Template einer PCR-Reaktion 
verwendet, um zu ermitteln, in welchen Verdunnungen noch Logomere detektierbar sind. 
Erhait man soicherart die ietzte Verdunnung, die noch Logomere enthalt, und die Verdunnung, 

20 die schon keine mehr enthalt, laBt sich ein ungefahrer Verdunnungsfaktor angeben, der 
g erac j e noch ungefahr ein Logomer enthalt. Gegebenenfalls kann dieser Verdunnungsfaktor 
durch Austitrieren der letzten Verdunnung, die noch Logomere enthalt, genauer bestimmt 
werden. Dabei verwendet man entsprechend kleinere Verdunnungsschritte (verdunnt man 
z.B. in der ersten Verdunnungsreihe immer 1:10, so kann man in der 2. Verdunnungsreihe z.B 

25 1:2 verdunnen; das Verfahren der genaueren Bestimmung des Verdiinnungsfaktors kann 
dabei prinzipiell mit beliebiger Genauigkeit angewendet werden). 

Da die PCR der Verdunnungen dazu dient, festzustellen, ob sich uberhaupt noch Logomere in 
der Verdunnung befinden, kann die PCR auf mindestens zweierlei Weise durchgefuhrt 
werden: 

30 a) Als Primer dienen zwei gegenlaufige, in den Terminatoren primende Primer, z.B. der 5'- 
Strang des Start-Terminators und der 3'-Strang des Ende-Terminators. Ansonsten sind 
die PCR-Bedingungen wie weiter unten unter Vervielfaltigung von Logomeren durch PCR 
beschrieben. 

b) Die PCR wird wie die zum Auslesen der Logomere durchgefuhrt, es reicht jedoch ein 
35 Ansatz mit einem Paar von Primern wie unter Auslesen von Logomeren mittels PCR im 

Folgenden beschrieben. 
Zur Kontrolle werden die durch PCR erhaltenen DNA Fragmente durch Gelelektrophorese 
sichtbar gemacht. Dazu wird z.B. ein 2-4%iges Agarose-Gel (z.B. UltraPure™ von Gibco BRL, 
Life Technologies, Katalog Nr.: 15510-027) und als Molekulargewichtsstandard z.B. eine 
40 50bp-Leiter (Gibco BRL, Life Technologies, Katalog Nr. 10416-014) verwendet. Das erhaltene 
Gel wird 5 Minuten in 0,001% Ethidiumbromid gefarbt und unter UV sichtbar gemacht. 
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Vervielfaltigung von Logomeren 



Die aus einer Symbolpolymerisation erhaltenen Logomere konnen - je nach ihrer 
beabsichtigten Verwendung - vervielfaltigt werden. Dies ist beispielsweise fur die 
Visualisierung der gespeicherten Information Oder die Weiterverwendung der Logomere als 
Marker zur Kennzeichnung von Stoffen und Gegenstanden notig. 



Vervielfaltigung von Logomeren durch PCR 

Bei diesem Verfahren werden Logomere durch PCR vervielfaltigt. Das zu vervielfaltigende 
Logomer dient als Template, die benotigten Primer primen jeweils gegenlaufig in den 
Terminatoren (entweder 5'-Start und 3-Ende, oder 5'~Ende und 3'-Start), so daB das Logomer 
vollstandig vervielfaltigt wird. Alternativ konnen die Primer, sofern das zu vervielfaltigende 
Logomer von weiterer DNA umgeben ist, auch weiter auBerhalb des Logomers primen. 

Fur die PCR-Ansatze, die in dem Fachmann bekannter Weise variiert werden konnen, 
werden z.B. folgende Reagentien und Bedingungen verwendet: 

dNTPs (z.B. Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (z.B. Gibco- 
BRL , Katalog Nr.n: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCI 2 (z.B. GIBCO- 
BRL, Katalog Nr.: 18067-017) 



25 



30 



35 



40 
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Menge 


dNTP, 10mM 


1 


PCR-Puffer 10x 


5 


MgCI 2l 25mM 


5 


TAQ, 5u///l 


0,5 


Primer 1, 10/iM 


1 


Primer 2, 10/yM 


1 


Template 


1 


(Logomer) 




H 2 0 


35,5 


Gesamtvolumen 


50 



Als PCR-Programm kann beispielsweise folgendes Protokoll (Primer: 30-mere) verwendet 
werden: 

Schritt Aktion Temperatur Dauer Gehe zu Anzahl 

Schritt Wiederholungen 



1 


Denaturiere 


95 °C 


00:05:00 


2 


Denaturiere 


95 °C 


00:00:30 


3 


Annealing 


68 °C 


00:00:30 


4 


Polymerisation 


72 °C 


00:00:30 


5 


Gehe zu 






6 


Kuhlen 


4°C 


(beliebig) 


7 


Ende 







5 Ein weiterer Gegenstand der Erfindung sind informationstragende Polymere, die gemaB den 
oben beschriebenen erfindungsgemaBen Verfahren erhaltlich sind. 

Auslesen der in Logomeren enthaltenen Information 

10 

Fertige Logomere konnen entweder mittels PCR (Polymerase Chain Reaction = 
Polymerasekettenreaktion), was erfindungsgemaG bevorzugt ist, oder mittels 
Restriktionsverdau gelesen werden. Dabei hat die PCR-Methode den Vorzug, bereits 
geringste Mengen DNA solcherart vervielfaltigen zu konnen, daB die Logomere direkt nach 
15 der PCR und einer Gel-Auftrennung gelesen werden konnen. Im Falle von binaren Logomeren 
kann das durch die PCR-Methode auf einem Gel erhaltene Bandenmuster unmittelbar als 
Binarcode gelesen werden. 

Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zum Auslesen von Information 
aus informationstragenden Polymeren, die wie oben beschrieben erhalten und/oder isoliert 
20 und vervielfaltigt wurden, dadurch gekennzeichnet, daB man 
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a) n das informationstragende Polymer enthaitende Losungen mit jeweils einem Paar 
gegeniaufiger Primer versetzt, wobei n fur die Zahl der als Elongatoren in dem 
Polymer enthaltenen Oligomere steht; 

b) mindestens n-1 PCR-Ansatze durchfuhrt, wobei n fur die Zahl der als Elongatoren in 
5 dem Polymer enthaltenen Oligomere steht und jeweils ein Primer eines jeden Paares 

in dem dem Eiongator gegenuberliegenden Terminator primt und der andere Primer 
in dem Eiongator selbst primt; 

c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Lange durch 
Elektrophorese auftrennt und 

10 d) das aus der Elektrophorese erhaltene Muster optisch ausliest. 

Das Verfahren kann auch unter Verwendung verschiedenfarbiger fluoreszenzmarkierter 
Primer oder Nukleotide durchgefuhrt werden. Dadurch wird es mogiich, mehrere Ansatze 
verschiedenfarbig zu markieren und mehrere Ansatze in einer Spur gelelektrophoretisch zu 
lesen. Uberdies kann der AusleseprozeB dadurch mit modernen Sequenziermaschinen (z.B. 

15 von ABl erhaltiich) automatisiert werden. 



Auslesen von Logomeren mittels PCR 

Urn die in Logomeren enthaltenen Informationen sichtbar zu machen, konnen die Logomere 
mithilfe der PCR ausgelesen werden. 

Die Methode des Auslesens binarer Muster mit PCR wurde als DNA Typing bereits von 
[Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204- 
209, (1991)] beschrieben. Die dort beschriebene Methode wird hier in einer abgewandelten 
Form als Auslese-PCR zum Auslesen der Logomere benutzt. Unterschiede zu der in [Jeffreys, 
Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)] 
beschriebenen Methode bestehen darin, daB hier synthetisch erzeugte Templates verwendet 
werden, die nicht notwendig binare Muster enthalten. AuBerdem werden PCR- und Gel- 
Elektrophorese-Bedingungen so gewahlt, daB das Ergebnis direkt vom Gel gelesen werden 
kann, ohne daB die als Bandenmuster erhaltenen Signale zusatzlich durch Blotting verstarkt 
werden mussen. 

a) PCR 

Fur das Auslesen eines Logomers werden fur n Elongatoren der zugrundeliegenden 
Grammatik mindestens n-1, meistens aber n PCR-Ansatze gebraucht. Jeder PCR-Ansatz 
enthalt das zu lesende Logomer als Template und auBerdem ein Paar gegeniaufiger Primer, 
von denen einer im Eiongator, der andere im, dem Eiongator gegenuberliegenden, Terminator 
primt (z.B. 5'-"Start" und 3'-0, siehe Abbildung 5). Fur die PCR kann jeder handelsubliche 
Thermozykler (z.B. PTC-100, MJ Research) verwendet werden. Als zweckmaBig fur die 
Lange der Primer haben sich 20-30bp erwiesen, jedoch sind auch andere Langen 
verwendbar. Je nach Primerlange muB die Annealing-Temperatur entsprechend gewahlt 
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werden (kann z.B. mithilfe des Programmes Oligo 5.0 bestimmt werden). ZweckmaBige 
Annealingtemperaturen sind fur 20-mere ca. 55°C, fur 30-mere etwa 65°C bis 74 °C. 
Fur die PCR-Ansatze werden z.B. folgende Reagentien und Protokolle verwendet, die in dem 
Fachmann bekannter Weise variiert werden konnen: 
5 dNTPs (Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (Gibco-BRL, 
Katalog Nr.n: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCi 2 (GIBCO-BRL, Katalog 



Nr.: 18067-017) 


Menge 


dNTP, 10mM 


1 


PCR-Puffer 10x 


5 


MgCI 2 , 25mM 


5 


TAQ, 5U///I 


0,5 


Primer 1, 10pM 


1 


Primer 2, 10//M 


1 


Template 


1 


(Logomer) 




H 2 0 


35,5 


Gesamtvolumen 


50 



Urn genugend DNA zu erhalten, so daf3 das erhaltene Bandenmuster nach der 
10 Gelelektrophorese direkt vom Gel gelesen werden kann, kann jeder PCR-Ansatz m mal 
angesetzt werden. Z.B. kann m = 4 sein. 



Als PCR-Programm kann folgendes Protokoll (Primer: 30-mere) verwendet werden: 
Schritt Aktion Temperatur Dauer Gehe zu Anzahl 

Schritt Wiederhoiungen 



1 


Denaturiere 


95 °C 


00:05:00 


2 


Denaturiere 


95 °C 


00:00:30 


3 


Annealing 


69,5 °C 


00:00:30 


4 


Polymerisation 


72 °C 


00:00:30 


5 


Gehe zu 






6 


Kuhien 


4 °C 


(beliebig) 


7 


Ende 







15 Nach durchgefuhrter PCR ist es fur die Lesbarkeit der Bandenmuster der nachfolgenden 
Gelelektrophorese evtl. zweckmaBig, moglichst viel amplifizierte DNA in moglichst geringem 
Volumen zu halten, das dann auf ein Gel geladen werden kann. Dazu konnen die Volumina 
auf geeignete Weise (z.B. mit einer SpeedVac, z.B. SpeedVac Concentrator, Savant) 
eingeengt werden. 

20 b) Gelelektrophorese 
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Die fur jeden Elongator aus der PCR erhaltenen DNA Fragmente haben verschiedene Lange. 
Werden sie durch Elektrophorese aufgetrennt, so ergeben die unterschiedlichen 
Langenfragmente ein spezifisches Muster, anhand dessen sich das zu lesende Logomer 
identifizieren ia3t (siehe Abbildung 5 und Abbiidung 6). Fur die Getelektrophorese kann ein 

5 4% Agarose-Gel (z.B. UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510- 
027), als Molekulargewichtsstandard z.B. eine 50bp-Leiter (Gibco BRL, Life Technologies, 
Katalog Nr.: 10416-014) verwendet werden. Die Auftrennung der DNA erfolgt in einer 
Gelkammer in geeigneter Weise, z.B. 1:45 Stunden bei 60V. Hier sind die Parameter jedoch 
relativ frei wahlbar, insbesondere kann die Gel-Laufzeit weiter verkurzt werden. 

0 Das erhaltene Gel wird 5 Minuten in 0,001% Ethidiumbromid gefarbt und unter UV sichtbar 
gemacht. 

Ein Beispie! fur ein solcherart erhaltenes Gel findet sich exemplarisch unter Abbildung 6. 



Auslesen von Logomeren durch Restriktionsverdau 

Logomere konnen durch Restriktionsverdau ausgelesen werden. Dazu mussen die 
Elongatoren so konstruiert sein, daf3 sie asymmetrisch versetzte Restriktionsschnittstellen 
tragen. Jeder Elongator tragt dabei eine spezifische Restriktionsschnittstelle. Beispielsweise 
kann das Restriktionsenzym EcoRV (z.B. NEB, Katalog Nr. #195S) fur 0-Elongatoren und 
Smal (z.B. NEB, Katalog Nr. #141S) fur 1 -Elongatoren verwendet werden. 
Zum Lesen wird das zu lesende Logomer in verschiedenen Restriktionsansatzen geschnitten. 
Dazu wird pro Elongator ein Restriktionsansatz mit dem jeweiligen Restriktionsenzym gebildet. 
Die aus der Restriktion erhaltenen DNA Fragmente sind von verschiedener Lange. Werden 
sie durch Elektrophorese aufgetrennt, so ergeben die unterschiedlichen Langenfragmente ein 
spezifisches Muster, anhand dessen sich das zu lesende Logomer identifizieren laBt. 
Das folgende Beispiel zeigt die DNA-Fragmentlangen aller binaren Logomere mit 4 Bit ohne 
Terminatoren mit Elongatorlange = 30bp; Restriktionsschnittstelle pro Elongator nach 10bp. 
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W W 

Binarzahl q 1 

0000 10,40,40,40,30 160 

0001 10) 40, 40, 70 1 30, 30 
0010 10, 40, 80, 30 90, 70 

5 0011 10, 40, 110 90, 40, 30 

0100 10, 80, 40, 30 : 50, 1 10 * 

0101 1 0, 80, 70 50, 80, 30 

0110 10, 120, 30 ;50, 40, 70 

0111 10, 150 50, 40, 40, 30 
1 0 1 000 50, 40, 40, 30 10, 1 50 

1001 50j 40j 70 10, 120, 30 

1010 50, 80, 30 10, 80, 70 

1011 50,110 10,80,40,30 
1100 90,40,30 10,40,110 

15 1101 90, 70 10, 40, 80, 30 * 

1110 130,30 10, 40, 40, 70 

1111 160 10, 40, 40, 40, 30 

im obigen Beispiel (4 Bits) erkennt man, daB die Langenmuster der Zahlen 0010 und 0100 bei 
Restriktion des O-Bits nicht eindeutig ist. 0010 und 0100 lassen sich jedoch anhand der 
20 Langenmuster bei Restriktion des 1-Bits unterscheiden. 

Im Einzelnen wurde zur Durchfuhrung des obigen Beispieis foIgendermaBen vorgegangen, 
wobei sich die Protokolie gemaB den Kenntnissen des Fachmanns variieren lassen: 

a) DNA Extraktion 

Eine z.B. durch Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung erhaltene 
25 Bakterienkolonie wird zum Animpfen von 2-5mi einer 37°C Ubernachtkultur verwendet (z.B. 
LB-Medium mit 10/yg/l Ampicillin wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular 
Cloning, A Laboratory Manual, (1989)] beschrieben). Ais Klonierungsvektor konnen hier z.B. 
pGEM-T Easy (Promega, Katalog Nr. A1360) und binare Logomere auch ohne Terminatoren 
verwendet werden. Aus der Ubernachtkultur wird die das Logomer enthaltende Plasmid-DNA 
isoliert (z.B. mithilfe des Qiagen Plasmid Miniprep Kit, Qiagen, Katalog Nr. 12123, oder durch 
alkalische Lyse wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A 
Laboratory Manual, (1989)] beschrieben). 

b) Restriktion 

Die aus a) erhaltene Plasmid DNA wird fur n Elongatoren in n Restriktionsansatzen 
geschnitten. Jeder Restriktionsansatz enthalt ein Restriktionsenzym, das in einem 
spezifischen Elongator schneidet und ein Restriktionsenzym, das das Logomer aus der 
Klonierungssite ausschneidet. Im verwendeten Beispiel wurden folgende Ansatze verwendet: 

Name Menge Volumen 

Plasmid Logomer in pGEM-T 500ng///l 6 
DNA Easy (s.o.) 

Puffer NEB2 10x 1 
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36 

BSA 10x 1 

Enzym 1 Eco RV 10u///l 1 

Enzym2 Eco Rl 10u///l 1 

Total 10 





Name 


Menge 


Volumen 


Plasmid 


Logomer in pGEM-T 500ng///l 


6 


DNA 


Easy (s.o.) 






Puffer 


NEB4 


10x 


1 


BSA 




10x 


0 


Enzym 1 


Sma ! 


10U///I 


1 


Enzym 2 


Eco Rl 


10u///! 


1 


H 2 0 






1 


Total 






10 



Die angegebenen Ansatze werden 1 Stunde auf 37°C inkubiert. 
c) Gelelektrophorese 

Die aus b) erhaltenen DNA Fragmente werden elektrophoretisch aufgetrennt (z.B. 4% 
Agarose UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027), mit 
Ethidiumbromid (0,001%) gefarbt und unter UV sichtbar gemacht (siehe Abbildung 8). 



0 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
binarer Logomere: 



15 



Binare Logomere werden mit Grammatiken erzeugt, in denen gilt: 

Z:= {0, 1, s 0 , s 1( s 2 Sn-i, s n , e 0 , e,, e 2 em.,, e m } mit n, m e W und n, m > 0. 

Sie ermoglichen die einfachste und universellste Darstellung von Daten, wie sie auch von 
herkommlichen Datenverarbeitungsmaschinen eingesetzt wird. Binare Logomere sind 
Resultat einer Bitpolymerisation. Da abhangig von der jeweils gewahlten Grammatik nahezu 
beliebige Symbole und Regeln kodiert werden konnen, konnen damit ebenso beliebige Daten 
und Datentypen erzeugt werden. 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
von Zeichenalphabeten: 

Logomere konnen eingesetzt werden, urn die Zeichen eines gewahlten Alphabetes zu 
5 kodieren. Die Zeichenlange kann dabei unterschiediich gewahlt werden, sinnvoil ist es jedoch, 
die auch fur herkommliche Datenverarbeitungsanlagen benutzten Zeichenlangen (Halbbyte, 
1-Byte, 2-Byte, 4-Byte, 8-Byte usw.) zu verwenden. Ebenso ist die Konvention fur die 
interpretation der dargestellten Zeichen wahlfrei. Die Zeichen konnen Zahlen, Buchstaben, 
alphanumerische Zeichen Oder beliebige andere Datenstrukturen sein. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
eines 1-Byte Alphabetes: 

Es sei eine Grammatik G = (E, V, R, S) mit Terminalalphabet 2L:= {0, 1 , s, e} f Variablenmenge 
15 V:={ So, Si, S 2l S 3 , S 4 , S 5 , Se. S 7 , S 8 }, Startsymbol S und Regelmenge 



10 



R:= 



20 



25 



30 



35 



S:=sS 0 
S 0 ->0Si 

5 0 - >1Si 

51- >0S 2 

51- >1S 2 

5 2 - >0S 3 

5 2 - >1 S 3 

s 3 ->os 4 

5 3 - >1S 4 

s 4 ->os 5 

5 4 - >1S 5 

5 5 - >0S 6 

5 5 - >1S 6 

5 6 - >0S 7 

5 6 - >1S 7 

s 7 ->os 8 

5 7 - >1S 8 

5 8 - >e 



wobei: 



s := Start 



e := Ende. 



40 



WO 00/59917 — 

PCT/EP00/02893 

Beispiel: 

nach den Regeln der angegebenen Grammatik konnen alle 8-Bit Zeichen erzeugt werden: 
z.B.: Erzeugung der 8-Bit 0, 00000000: 

S-> SS 0 -> SOS, -> s00S 2 -> s000S 3 -> SOOOOS4 -> SOOOOOS5 -> sOO0OO0S 6 -> SOOOOOOOS7 -> 

sOOOOOOOOSe -> sOOOOOOOOe 

z.B.: Erzeugung der 8-Bit 255, 11111111: 

S-> sSi -> s1S, -> S11S 2 ->S111S 3 ->s1111S 4 -> SIIIHS5 -> s111111Se-> SIIIIIHS7 -> 

s11111111S 8 ->s111inile 

z.B.: Erzeugung der 8-Bit 85, 01 01 01 01 : 

S-> sS 0 -> sOS 7 -> s01S 2 -> SOIOS3 -> SOIOIS4 -> S01010S 5 -> s010101S 6 -> s0101010S 7 -> 
s01 01 01 01 S 8 -> s01 01 01 01 e 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren, 
wie in den erfindungsgemaBen Schritten II und III beschrieben, hergestellt. Algomere und 
Logomere werden, wie in den erfindungsgemaBen Schritten IV - V beschrieben, hergestellt 
und die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und 
Vervielfaltigung von Logomeren dutch Klonierung beschriebenen Verfahrens isoliert und 
vervielfaltigt. Die solcherart erzeugten alphanumerischen Zeichen konnen jetzt fur 
verschiedene technische Zwecke (z.B. die Markierung und Identifizierung von Stoffen) 
eingesetzt werden und. evtl. nach zusatzlichen technischen Schritten, gemaB dem 
erfindungsgemaBen Verfahren zum Auslesen von Information aus informationstragenden 
Polymeren (wie oben beschrieben) ausgelesen werden. 

Da die hier erzeugten Binarmuster wahlfrei als Daten und Symbole gelesen werden konnen, 

konnen sie z.B als alphanumerische Zeichen interpretiert werden. Werden sie als Zahlen 

interpretiert, so erzeugt die angegebene Grammatik 8-Bit Zufallszahlen. 

Aus einer genugend groBen Menge zufalliger 8-Bit Binarmuster konnen alle 8-Bit Muster 

isoliert und als Bibliothek (z.B. zur Darstellung aller alphanumerischen Zeichen) angelegt 

werden. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Darstellung von 
Zeichenketten: 

Da Algomere so hergestellt werden k6nnen, daB sich unterschiedlich lange Logomere 
erzeugen lassen, ist es moglich, auch Zeichenketten darzustellen. Aus praktischen Grunden 
ist es jedoch zweckmaBig, nur wenige Zeichen pro Logomer vorzusehen. Z.B. kann ein 
einzelnes Logomer 4 Bit (Halbbyte) Oder 8 Bit (1 Byte) enthalten. (Falls mehr Bit erforderlich 
sind, sollten zweckmaBigerweise immer Vielfache von 8 Bit = 1 Byte verwendet werden.) In 
Binardarstellung konnen dann beliebige alphanumerische Zeichen in beliebiger Kodierung 
(z.B. ASCII, ANSI, ISO 8859-x, Unicode) dargestellt werden. Dabei kann sich ein Zeichen 
auch iiber mehrere Logomere erstrecken (Bsp.: Halbbyte-Darstellung, bei der sich jeweils ein 
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1-Byte Zeichen uber zwei Logomere erstreckt, oder Unicode, bei der sich ein 16-Bit Zeichen 
Gber zwei 8-Bit oder vier 4-Bit Logomere erstreckt). Fur die Darsteliung von Zeichenketten ist 
es dann notig, die einzelnen Zeichen mit Positionsinformation zu versehen. Dazu reicht es, in 
den jeweiligen Grammatiken verschiedene Terminatoren (z.B. verschiedene "Start"- 
5 Terminatoren) zu verwenden, deren Sequenzen jeweils die Positionsinformation 
reprasentieren. 

Beispiel: Es sei eine Grammatik G = (2, V, R, S) mit Terminalalphabet Z:= {0, 1, e, s 0 , s u s 2 , 
Sn-1, s n }, Variablenmenge V:={ So, S,, S 2j S 3l S 4 , S 5) S 6l S 7 , S 8 }, Startsymbol S und 
Regelmenge 

10 R:= 
{ 

St— SjSo 
S 0 ->0Si 

5 0 - >1 Si 
15 S!->0S 2 

51- >1S 2 

5 2 - >0S 3 
S 2 ->1S 3 

s 3 ->os 4 

20 S 3 ->1S4 
S 4 ->0S 5 

5 4 - >1S 5 

5 5 - >0S 6 

5 5 - >1S 6 
25 S 6 ->0S 7 

5 6 - >1 s 7 

s 7 ->os 8 

5 7 - >1S 8 

5 8 - >e 

30 } 

wobei: 

Sj := Start, mit i = {0, n} 
e := Ende. 

35 Das mit dieser Grammatik erzeugte 1-Byte Alphabet reicht z.B. fur alle alphanumerischen 
Zeichen des ASCII, ANSI oder ISO 8859-x Standards. Fur eine Zeichenkette der Lange n 
werden n verschiedene Terminatoren benotigt, so daB die mit dieser Grammatik erzeugten 
Zeichenketten wie folgt aufgebaut sind: 
Soxe, s n xe, s^xe, s n xe 

40 wobei x eine beliebige Binardarstellung mit, in diesem Fall, 8 Bit ist. 
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W 9 

Es bedeutet dann: 

s 0 xe := Zeichen x an Position 0 (O.tes Zeichen) 
s,xe := Zeichen x an Position 1 (1 .tes Zeichen) 
s 2 xe := Zeichen x an Position 2 (2.tes Zeichen) 
usw. 

Mit der Grammatik laBt sich beispielsweise die Zeichenkette "Elisabeth" im ASCII-Code 
darstellen: 

s 0 01000101e, s,01101100e, s 2 01101001e, s 3 01110011e, s 4 01100001e, s 5 01100010e, 
s 6 0 1 1 001 01 e, s 7 01 1 1 01 OOe, s 8 0 11 01 OOOe 

Alternate kann auch Z:= {0, 1, s, e 0 , e,, e 2> e n „ e n} gewahlt werden, wodurch die 
Zeichenkette "Elisabeth" im ASCII-Code als: 

S01000101e 0> S01101100S,, s01101001e 2 , 80111001 16a. s01100001e 4> s01100010e 5 , 
s01 1 001 01 e 6> s01 1 1 01 00e 7 , s01 1 01 000e 8 

dargestellt wird. Eine weitere Moglichkeit ist Z:= {0, 1 , s 0 , s„ s 2 , .... Sn . 1( s n , e 0 , e„ e 2) e Ml 
e n }, womit die Zeichenkette "Elisabeth" im ASCII-Code als: 

s 0 01000101e 0> 8,01101100*. s 2 01 101001e 2 , s 3 01 1 1001 1e 3 , s 4 01 1 00001 e 4 , s s 01100010e 5 , 
s 6 01100101e 6 , s 7 01110100e 7 , s e 01101000e 8 
dargestellt wird. 

In Halbbyte-Darstellung mit Positionsinformation wurde die Zeichenkette "Elisabeth" im ASCII- 
Code dargestellt als: 

s 0 0100e, s l0 101e, s 2 0110e, s 3 1100e, s 4 0110e, s 5 1001e, s 6 0111e, s 7 0011e, s 8 0110e, s 9 0001e, 
s 10 0110e, Sl1 0010e, s 12 0110e, s 13 0101e, s 14 0111e, s l5 0100e, s 16 0110e, s 17 1000e 

Aufgrund der Positionsinformation, die durch die Sequenz der Terminatoren reprasentiert 
wird, konnen die einzelnen Zeichen vollig unabhangig voneinander verarbeitet werden und 
z.B. getrennt voneinander gelesen werden. 

Mit einem solchen Alphabet ist die Darstellung beliebiger Datentypen moglich. Z.B. konnen 

z.B. jeweils zwei Byte (0. + 1., 2. + 3 n. + n+ 1.) zu einem 2-Bytecode (z.B. Unicode) 

zusammengefaBt werden. Alphanumerische Zeichenketten konnen verwendet werden, urn 
beliebige Bezeichner (Namen, Zahlen, Datum usw.) darzustellen. 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren, 
wie in den erfindungsgemaBen Schritten II und III beschrieben, hergestellt. Algomere und 
Logomere werden, wie in den erfindungsgemaBen Schritten IV - V beschrieben, hergestellt, 
die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervieimitigung 
von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfaltigt. Die 
solcherart erzeugten alphanumerischen Zeichen und Zeichenketten konnen jetzt fur 
verschiedene technische Zwecke (z.B. die Markierung und Identifizierung von Stoffen) 
eingesetzt werden und, evtl. nach zusatzlichen technischen Schritten, gemaB dem 
erfindungsgemaBen Verfahren zum Auslesen von Information aus informationstragenden 
Polymeren (wie oben beschrieben) ausgelesen werden. 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
eines Zufallszahlengenerators: 

Fur bestimmte Probleme der Informatik (z.B. Simulationen) und der Mathematik werden 
5 Zufallszahlen benotigt. Diese werden im allgemeinen rechnergestutzt durch Algorithmen 

erzeugt. Da diese Algorithmen jedoch deterministisch sind, handelt es sich bei den erzeugten 

Zufallszahlen nur um Pseudo-Zufallszahlen. Oberdies sind die erzeugten Zahlenreihen 

aufgrund der unterschiedlichen Gute der Algorithmen unterschiedlich gut randomisiert. 

Fur manche Anwendungen werden daher echte Zufallszahlen benotigt. 1st dies der Fall, muG 
10 ein physikaiischer ProzeB in die Erzeugung von Zufallszahlen einbezogen werden. Ein solcher 

ProzeB ist etwa das Rauschen der Soundkarte in einem PC, das von entsprechender 

Software verarbeitet wird. 

Mithilfe der hier beschriebenen Verfahren kann ein echter Zufallszahlengenerator 
impiementiert werden, der Zufallszahlen sehr viel schneller erzeugt, als es mit herkommiichen 

15 Verfahren moglich ist. 

Der Zufallszahlengenerator wird mit folgender Grammatik impiementiert (Grammatik fur 

binare Zufallszahlen beliebiger Lange): 

G = (£, V, Ft, S) mit 2L:= {0, 1 , s, e}, V:={S}, 

R:= 
20 { 

S := sA 
A->0A 
A->1A 
A->e 

25 } 

wobei 

s:= Start 
e:= Ende 

Mit dieser Grammatik konnen Worter uber dem oben angegebenen Terminalalphabet 
30 Z:= {0, 1 , s, e} 

gebildet werden. Alle Worter der Sprache L beginnen mit „s" und horen mit „e" auf, 
dazwischen befindet sich eine zufallige Anzahl (auch 0) zufalliger Bits („0" und „1"). 

Beispiel: Worter aus der Sprache L, die nach R gebildet werden: 
35 S->sA->se 

S->sA->s1A->s1e 

S->sA->s0A->s00A->s001 A->s001 OA->s001 Oe 

S->sA->s1 A->s1 0A->s1 00A->s1 000A->s1 0OOOA->s1 000OOA->s1 OOOOOe 
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Die als Worter der Spache L erzeugten Binarmuster konnen als Buchstaben, Zahlen, 
alphanumerische Zeichen oder Zeichenketten gelesen werden. Liest man sie als die 
Binardarstellung von Zahlen, so sind diese Binarmuster in Dezimaldarstellung: 
0 (leer) 
5 1 
2 

32 

und konnen als Zufallszahlen verwendet werden. Zur in vitro Implementierung eignen sich 
prinzipiell beliebige Sequenzen, solange sie eindeutig und zueinander maximal unahnlich sind. 
10 Z.B. kfinnen folgende Algomere verwendet werden: 
sA: 

agctttatatctccatttgccctagtgaag 

aatatagaggtaaacgggatcacttcaacc 

A->0A: 

ttggcgagatatcaacgccaccccttgctt 

gctctatagttgcggtggggaacgaaaacc 

15 A->1A: 

ttggcgacccgggaaacaactattgctagt 

gctgggccctttgttgataacgatcaaacc 

A->e: 

ttggtgcgggagttggaagcaactacgatg 

acgccctcaaccttcgttgatgctacctag 
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Die dazu benStigten Sequenzen sind handelsublich. Sie konnen z.B. bestellt werden als 
40nmol, PAGE gereinigt (ARK-Scientific, Darmstadt) und z.B. 100//M in Aqua dest. 
aufgenommen werden (empfohlene Lagerung bei -20°C). Aus den Sequenzen werden, wie 
im erfindungsgemaBen Schritt IV beschrieben, Algomere hergestellt. Diese Algomere werden, 
wie im erfindungsgemaBen Schritt V beschrieben, zu Logomeren polymerisiert und konnen 
gemaB dem erfindungsgemaBen Verfahren zum Auslesen von Information aus 
informationstragenden Polymeren (wie oben beschrieben) ausgelesen werden. Derart 
erzeugte Zufallszahlen sind in Abbildung 6 zu sehen. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Verschliisselung 
30 von Logomeren: 

Die in Logomeren enthaltene Information kann verschliisselt werden. Dazu fungiert 
mindestens einer der fur die Auslese-PCR benotigten Primer als geheimer Schlussel (siehe 
Abbildung 11). Bevorzugt ist dies einer der in den Terminatoren primenden Primer. 1st die 
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Sequenz dieses Primers (Schliisselsequenz) und der Primer selbst nur autorisierten 
Zugreifern bekannt, so ist die in den derart verschlusselten Logomeren enthaltene Information 
auch nur autorisierten Zugriffen zuganglich. 

Urn ein Auslesen der in den Logomeren enthaltenen Information ohne diesen Schlussel zu 
5 verhindern, miissen weitere Vorkehrungen getroffen werden. Versuche, die Verschlusselung 
zu brechen, konnen darauf beruhen, uber die Vervielfaltigung nicht-geheimer Sequenzen auch 
die Logomere zu lesen. Sofern bakterielle Vektoren zur Klonierung von Logomeren verwendet 
werden, konnte ein potentieller Angreifer z.B. versuchen, die gesamte Klonierungssite mit 
PCR zu vervielfaltigen und dann mit Sequenzierung zu lesen Oder uber die zur Selektion 
10 benotigten Resistenzgene in die Klonierungssite "hineinzulesen". Auch konnten die 
Elongatoren selbst als Ansatzpunkte fur ein PCR-basiertes Lesen der geheimen Sequenz(en) 
dienen. 

Solchen Angriffsversuchen ist gemein, daB sie uber nicht-geheime Sequenzen versuchen 
konnten, die Schliisselsequenz zu entschlusseln und daruber die verschlusselte Sequenz zu 
15 lesen. Eine Abwehr derartiger Angriffsversuche kann dadurch erfolgen. daB zum 
Informationstransport uber Logomere immer nur vollstandig geheime Sequenzen verwendet 
werden. Jedoch ist dies evtl. zu aufwendig und kostentrachtig. Stattdessen Oder erganzend 
dazu konnen die informationstragenden Logomere mit Sequenzen (Scheinsequenzen) 
versetzt werden, die dieselben potentiellen Angriffspunkte (z.B. Bits, Resistenzgene) 
20 enthalten, jedoch jeweils andere Schlusselsequenzen. Durch diese Scheinsequenzen laufen 
potentielle Angiffsversuche ins Leere, weil fur den nicht-autorisierten Zugreifer alle 
Einzelsequenzen ununterscheidbar und dadurch die verschlusselten Informationen verborgen 
sind. Mit je mehr Scheinsequenzen ein Logomer versetzt ist, urn so schwieriger wird es, die 
Schliisselsequenz zu brechen. 
25 Das Verfahren entspricht einer molekularen Steganografie und wird exemplarisch anhand der 
Verschlusselung von Zeichen eines 1-Byte Alphabetes gezeigt: 

Es sei die verwendete Grammatik G = (£, V, R, S) mit Terminalalphabet S:= {0, 1 , s key , s 0) s„ 

S2 s,.,, Sj , e}, wobei f e IN, f ;> 1. s key ist der geheime Schlussel. Fur eine Schlussellange 

von I ist dann die maximale theoretische Verschlusselung Key™ = a 1 , die maximal 
30 verwendbare Verschlusselung Key e „ = a M . wobei d die Anzahl der Basen angibt, in der sich 
ein Scheinschlussel von dem richtigen Schlussel unterscheiden muB, damit in der Auslese- 
PCR kein Scheinschlussel die richtige Sequenz lesen und umgekehrt der richtige Schlussel 
kein Scheinlogomer (sondern nur das Ziellogomer) auslesen kann. Fur hochspezifische PCR 
Konditionen kann d > 1 werden. Weiterhin gibt Key imp = Anzahl Scheinschlussel + 1 die 
35 tatsachlich verwendete Verschlusselung und Key min = 1 + x die minimale Verschlusselung an. 
Dabei ist x die zu einer minimaien Verschlusselung notige Anzahl von Scheinlogomeren. 
Diese kann im Falle der Verwendung von n Logomeren als Informationstrager groBer als n 
gewahit werden. 

Fur Zeichenketten ergibt sich automatisch eine zusatzliche Verschlusselung, weil hier die fur 
einen potentiellen Angreifer unbekannte Reihenfolge der Zeichen zusatzlich verschliisselnd 



40 

wirkt. 
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Beispiel: Fur eine Grammatik mil Zeichenketten von n 1-Byte Zeichen wird folgende 
Grammatik G verwendet: 

Es sei G = (I, V, R, S) mit Terminalalphabet I:= {0, 1. s ke *, s key1 , s key2 , .... s^, s teyn , s 0 . s„ 
82 Sm ' Sf> e)> wobei n.f e n a 1. n gibt dabei die Anzahl der verwendeten echten 
Schlussel, f die Anzahl der verwendeten Scheinschlussel an; die verwendete Variablenmenge 
V und die verwendete Regelmenge R sind dabei wahlfrei und abhangig von der zu 
kodierenden Information. 

Grammatiken mit anderer Zeichenkodierung funktionieren analog. 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren, 
wie in den erfindungsgemaBen Schritten II und III beschrieben, hergestellt. Algomere und 
Logomere werden, wie in den erfindungsgemaBen Schritten IV - V beschrieben, hergestellt, 
d.e erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfaltigung 
von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfaltigt. Die 
solcherart erzeugten Logomere konnen, wie bereits als Auslese-PCR beschrieben 
ausgelesen werden, wobei - wie beschrieben - einer der zum Auslesen benotigten Primer' 
bevorzugt einer der in den Terminatoren primenden Primer, als geheimer Schlussel fungiert 
Mit der oben beschriebenen Grammatik werden zusatzlich zu den informationstragenden 
Logomeren „Scheinsequenzen" („Scheinlogomere«) erzeugt, die einen nicht-autorisierten 
Auslese-Zugriff auf die in den Logomeren enthaltenen Informationen verhindern sollen Das 
Verfahren kann fur alle Anwendungen von Logomeren benutzt werden und hat u.a den 
Vorzug. durch die Spezifitat des als geheimer Schlussel benutzten Primers sehr effektiv zu 
sein. 



Bas,erend auf der beschriebenen Methode konnen symmetrische und asymmetrische 
Verschlusselungsverfahren implementiert werden. Fur ein symmetrisches 
Verschlusselungsverfahren reicht es, daB sich die Teilnehmer A und B einer Kommunikation 
auf erne geheimgehaltene Schliisselsequenz einigen. Teilnehmer B verschlusselt eine als 
Logomer gespeicherte Nachricht an A, indem B Logomere nur mit den geheimen 
Term.natoren herstellt und seine Nachricht mit zusatzlichen Logomeren versetzt, die andere 
Terminatoren tragen. Nur A ist es dann moglich, das zum Auslesen benotigte Primerpaar 
bereitzustellen, da nur A die benotigte Terminatorsequenz kennt. 

Ein asymmetrisches Verschlusselungsverfahren erfordert dagegen zusatzlichen Aufwand z B 
den Bnsatz von Molekulen mit irregularen Formen (siehe z.B. Abbildung 12 und Abbildung 
13): Will ein Kommunikationsteilnehmer B eine verschlusselte Nachricht an A schicken so 
bekommt er von A einen offentlichen Schlussel, den er zur Verschlusselung der als Logomer 
reprasentierten Nachricht verwenden kann. Der dffentliche Schlussel von A besteht aus einem 
Paar von Terminatoren und einem Pool zusatzlicher Scheinterminatoren mit ahnlichen 
Eigenschaften, jedoch abweichenden Sequenzen und anderen 3'-Uberhangsequenzen Von 
den echten Terminatoren ist lediglich die 3' Oberhangsequenz bekannt, mit der sie an die - 
offentlich bekannten - Elongatoren verknupft werden kann. Zur Verschlusselung einer 
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Nachricht erzeugt B Logomere, wobei er in der Symbolpolymerisationsreaktion den von A 
offentlich bereitgestellten Schlussel (enthaltend Terminatoren und Scheinterminatoren) 
verwendet. Die Art und Weise der Terminatoren gewahrleistet nun, da3 lediglich A in der Lage 
ist, die solcherart verschlusselte Nachricht wieder zu lesen: Da nur A die tatsachliche Sequenz 
5 der echten Terminatoren kennt, ist nur A in der Lage, die als Logomere verschlusselte 
Nachricht uber Auslese-PCR wieder zu lesen. 

Weil der offentliche Schlussel potentiell uber die bekannte Oberhangsequenz zu den 
Elongatoren angreifbar ist (weil die Scheinterminatoren diese Oberhangsequenz nicht 
besitzen durfen, kann ein potentieller Angreifer eine beliebige Sequenz an die echten 

10 Terminatoren knupfen, wodurch die Sequenz der Terminatoren identifiziert werden kann), 
werden als Terminatoren Molekule auf der Basis irreguiarer Formen, z. B. auf der Basis der in 
Abbildung 12 gezeigten Y-formigen Molekule verwendet. Die gezeigten Y-formigen Molekule 
lassen sich zu weiter verzweigten baumartigen Molekulen zusammensetzen. Die Wurzel eines 
soichen als Baum realisierten Terminatormolekuls enthalt dann die zu den Elongatoren 

15 kompatible Oberhangsequenz, wahrend nur eine der Aste des Baumes die echte 
Terminatorsequenz enthalt. Da die verschlusselte Nachricht wie oben beschrieben zusatzlich 
mit Scheinlogomeren versetzt ist, kann dann nur A, der die echte Terminatorsequenz kennt, 
aus der Menge der Molekule die richtige Nachricht durch Verknupfen mit dem kompatiblen 
Vektor herausfiltern, wohingegen ein potentieller Angreifer ohne Kenntnis der echten 

20 Terminatorsequenz dies nicht kann. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Verschlusselung 
mit Echtzeit-ldentifizierung: 

25 

Ohne das Auslesen der in verschlusselten Logomeren enthaltenen Informationen kann das 
Vorhandensein der Schlusselsequenz selbst Auskunft daruber geben, ob ein 
gekennzeichnetes Produkt echt ist, oder nicht. Die Information uber die Authentizitat des 
gekennzeichneten Produktes kann dabei uber einen ProzeB, bei dem der Schiusselprimer als 
30 Hybridisierungssonde einer Fluoreszenz-Nachweisreaktion dient, verifiziert oder falsifiziert 
werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
35 informationstragenden Polymere, zur Verschlusselung von Information. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise einen Test der 
Qualitat von Oligonukleotiden: 

40 
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Ein typisches Problem bei der Herstellung von Oligonukleotiden, z.B. fur molekularbiologische 
Zwecke, ist die Qualitatskontrolle derselben, die aufgrund des Herstellungsprozesses und der 
schwankenden Qualitat der verwendeten Chemikalien problematisch ist. 
Das in den erfindungsgemaBen Schritten I - V beschriebene Verfahren kann benutzt werden, 

5 die Qualitat von Oligonukleotiden zu testen. Dazu wird eine binare Grammatik wie die fur den 
Zufallszahlengenerator (s.o.) oder eine unare Grammatik wie die zur Herstellung von 
Molekulargewichtsstandards (s.u.) zur Erzeugung beliebig langer Logomere verwendet. Bei 
ansonsten identischen Bedingungen ist dann die Lange der aus einer Symbolpolymerisation 
(Schritt V des erfindungsgemaBen Verfahrens) erhaltenen Logomere direkt proportional zur 

0 Qualitat der verwendeten Oligonukleotide: Je langer die elektrophoretisch sichtbar gemachten 
Logomere sind, desto besser ist die Qualitat der verwendeten Oligonukleotide. Ein Beispiel fur 
die aus einer Symbolpolymerisation erhaltene Leiter unterschiedlich langer Logomere findet 
sich unter Abbildung 3. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
5 informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
informationstragenden Polymere, zur Qualitatskontrolle synthetisch hergestetlter 
Oligonukleotide. 



20 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung von 
Logomeren als Marker und Signaturen 

Aufgrund der Fahigkeit, prinzipiell beliebige Informationen darzustelien, lassen sich die hier 
beschriebenen Logomere als Marker verwenden, urn Erzeugnisse, Produkte, Stoffe und 
25 Gerate zu kennzeichnen. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
informationstragenden Polymere, als Marker oder Signaturen. 

Die Logomere konnen als "binares Etikett" verwendet werden, das einem Erzeugnis 
30 hinzugefugt wird und Informationen uber das derart gekennzeichnete Erzeugnis enthalt. Die 
Logomere konnen dabei z.B. Informationen uber 

a) Hersteller 

b) Produkt (z.B. Seriennummer) 

c) Verwendungszweck 
35 d) Stoffklasse 

e) Gefahrenklasse 

f) Qualitat 

g) Reinheit 

h) Produktions- und Verfallsdatum 

40 enthalten. Es lassen sich damit nahezu beliebige Produkte und Erzeugnisse mit nahezu 
beliebigen Informationen versehen. Da die Logomere ungiftig und biologisch abbaubar sind, 
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konnen sie auch fur hochsensible Produkte wie Nahrungsmittet, Medikamente und 
pharmazeutische Erzeugnisse eingesetzt werden. 
Gekennzeichnete Erzeugnisse konnen z.B. sein: 

a) chemische Erzeugnisse, z.B. Lacke. Farben, 6le, Schmier- und Treibstoffe, 
5 Losungsmittel, Tinte usw. 

b) flussige Materialien: Losungen, Suspensionen, Emulsionen 

c) gentechnische Erzeugnisse 

d) Nahrungsmittel, z.B. zur Kennzeichnung gentechnisch veranderter Bestandteile oder dem 
Monitoring von Nahrungsmitteln wahrend des Produktionsprozesses 

10 e) Medikamente und pharmazeutische Erzeugnisse 

f) Papiererzeugnisse, Dokumente, Geld 

g) Gerate 

Der Bedarf zur Kennzeichnung von Produkten besteht in den unterschiedlichsten Bereichen 
15 und aufgrund unterschiedlicher Anforderungen. Grunde fur eine Kennzeichnung konnen z.B. 
sein: Qualitatssicherung beim ProduktionsprozeB, Oberwachung der Produktreinheit und 
Vermeidung von Kontaminationen, Schutz vor Falschung und Produktpiraterie, Nachweis 
bestimmter Produktbestandteile, Produktkennzeichnung mit beliebigen Produktinformationen. 
Dieser Bedarf stellt sich auch in besonders sensiblen Bereichen, etwa bei der Kennzeichnung 
20 von Nahrungsmitteln, medizinischen und pharmazeutischen Erzeugnissen und gentechnisch 
hergestellten oder veranderten Erzeugnissen. Hier ist es wunschenswert, dal3 Informationen 
uber das jeweilige Produkt direkt am Produkt verfiigbar sind, insbesondere wenn 
Verwechselungen oder Falschungen vermieden werden sollen und auch die Identifikation 
unterschiedlicher Bestandteile eines Erzeugnisses gewiinscht ist. 
25 Es gibt zahlreiche Beispiele fur den Bedarf von Produktkennzeichnungen. Z.B. konnen 
Logomere als Seriennummem eingesetzt werden, die in Autolacke gemischt werden, wodurch 
der Fahrzeughalter im Versicherungsfall (z.B. Unfall oder Diebstahl) identifiziert werden kann. 
Durch Produktkennzeichnungen konnte die Qualitat und Reinheit chemischer Erzeugnisse 
uberwacht und Kontaminationen vermieden werden. Ein permanentes Problem ist die 
30 Falschung von Dokumenten, Unterschriften und Geld, die hochentwickelte 
Kennzeichnungsverfahren notig macht. 

Vor allem vor dem Hintergrund von Tierkrankheiten und -seuchen (BSE, Schweinepest, 
Salmonellenvergiftungen usw.) stellt sich das Problem der Qualitatssicherung von 
Nahrungsmitteln und der Kennzeichnung von Endprodukten, urn kontaminierte Produkte vom 

35 Verbrauch fernzuhalten. Ein weiteres Problem sind Nahrungsmittel, die gentechnisch 
hergestellte Bestandteile enthalten. Diese Bestandteile konnen ohne ein 
Kennzeichnungsverfahren im Endprodukt uberhaupt nicht Oder nur sehr schwer 
nachgewiesen werden. Das Problem stellt sich insbesondere dadurch. daB viele 
Nahrungsmittel Bestandteile unterschiedlicher Herkunft enthalten und die Produktionswege 

40 teilweise undurchschaubar sind. 
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Das Problem der Kennzeichnung stellt sich z.B. auch im Bereich von Blutprodukten, wo z.B. 
durch Pooling Kontaminationen auftreten konnen. Auch ware es hier z.T. wunschenswert, 
Informationen uber Identitat, Herkunft, Produktions- und Verfallsdatum direkt mit dem Produkt 
verfugbar zu haben. Ahnliches gilt auch fur Medikamente und pharmazeutische Produkte. 

5 

Bisher verwendet man zur Kennzeichnung und Markierung von Farben, Lacken, Treibstoffen, 
usw. verschiedene Kohlenstoffverbindungen, Polyaniline, Flussigkristalle Oder andere 
chemische Verbindungen. Diese Stoffe und Verbindungen haben unterschiedliche 
Schwachen: sie sind z.T. toxisch, nur schwer biologisch abbaubar, die verfugbare 
10 Informationskapazitat ist stark eingeschrankt, sie wechselwirken chemisch mit bestimmten 
Stoffen oder sind nur teuer und aufwendig herzustelien. 

Fur den Einsatz zur Kennzeichnung von sensiblen und hochsensiblen Erzeugnissen wie 
Nahrungsmitteln oder Medikamenten sind die genannten Stoffe und Verbindungen aufgrund 
der genannten Nachteile uberhaupt nicht geeignet. 
15 Die Anforderungen, die sich fur ein Kennzeichnungsverfahren von beliebigen Erzeugnissen 
stellen umfassen zumindest: 

Die Kennzeichnung sollte direkt im oder am Erzeugnis verfugbar sein; 

die Kennzeichnung sollte gut nachweisbar sein; 

die Kennzeichnung muB gesundheitlich unbedenklich sein. 
20 Gegenuber den bisher verwendeten Verbindungen haben die hier beschriebenen Logomere 
folgende Vorzuge: 

Kodierung beliebiger Informationen, 

hohe Speicherkapazitat, 

gesundheitlich unbedenklich, 
25 - chemisch, biologisch, pharmakologisch und genetisch neutral, 

ieicht biologisch abbaubar (Biomolekule), 

keine Umweltbelastung, 

sehr gute Nachweisbarkeit, 

- hohe Kompatibilitat zu bestehenden Techniken der Informatik und Molekularbiologie 
30 (PCR), 

- Informationen konnen verschiusselt werden und eignen sich auch zu Authentifizierung 
und Verschlusselung, 

Identifikation einzelner Bestandteile in Produktmischungen, 

- billig in groBen Mengen herzustelien (Klonierung, Vervielfaltigung mit Bakterien in 
35 Fermentern). 

Diese Eigenschaften machen Logomere fur die genannten Aufgaben sehr viel besser 
geeignet als die bestehenden Techniken. Oberdies erschlieBen sich Einsatzbereiche, die mit 
den bisherigen Techniken nicht mogiich waren. 
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Aufgrund der Eigenschaften nukleinsaurebasierter Logomere konnen diese auch zur 
Kennzeichnung von besonders sensiblen Produkten wie Nahrungsmitteln und 
pharmazeutischen Erzeugnissen verwendet werden. 

Die Grunde dafur liegen zum einen in der chemischen Beschaffenheit nukleinsaurebasierter 
5 Logomere und zum anderen in der Kodierung von Informationen in Logomeren: 

1) Als "Grundbausteine des Lebens" sind Nukleinsauren Elementarbausteine aller bisher 
bekannten biologischen Lebensformen. Daher konnen sie aufgrund ihrer chemischen 
Beschaffenheit fur keinen bekannten biologischen Organismus schadlich sein 
("biochemische Kompatibilitat"). Aufgrund der enthaltenen genetischen Informationen (des 
10 enthaltenen Programmes) konnen Nukleinsauren jedoch sehr wohl potentiell schadlich 

sein, wenn sie in einem Organismus abgelesen werden: Falls sie etwa fur giftige Proteine 
kodieren oder (wie im Falle viralen Erbgutes) einen jeweiligen Zielorganismus 
"umprogrammieren" konnen. Die hier verwendeten Logomere konnen jedoch aus den im 
Folgenden genannten Grunden keine fur einen Organismus schadlichen Informationen 
15 enthatten. 

2) Logomere enthatten keine genetischen, d.h. biologisch relevanten Informationen 
("semantische Inkompatibilitat"): Bezuglich der enthaltenen Informationen entsprechen 
Logomere Buchstaben, Zahlen oder Folgen von Buchstaben und Zahlen in 
Binarkodierung, die fur uns oder einen Computer, jedoch nicht fur den genetischen 

20 Apparat eines Organismus lesbar sind. Fur einen biologischen Organismus sind sie 

schlicht "Unsinnscode". 

3) Logomere, insbesondere die Algomere, aus denen sie aufgebaut sind, sind zu kurz urn 
auch nur zufallig biologisch relevante Informationen zu enthatten. 

4) Urn jede Eventualitat (der unwahrscheiniiche Fall, daB die Binarinformationen der 
25 Logomere auf irgendeine Weise von irgendeinem Organismus als genetisch relevante 

Information interpretiert wird) auszuschiieBen, werden die zur Kodierung von Symbolen 
verwendeten Sequenzen im Falle sensibler Anwendungsbereiche mit Stopcodons 
versehen, so daB sie niemals von einem biologischen Organismus abgelesen werden 
konnen. 

30 5) Als elementare Bestandteile aller biologischen Organismen sind Nukleinsauren in unserer 
Umwelt allgegenwartig. Sie werden in kurzester Zeit abgebaut. 

Urn als Marker eingesetzt zu werden, konnen Logomere nach den in den erfindungsgemaBen 
Schritten I - V beschriebenen Verfahren erzeugt und nach den erfindungsgemaBen oben 

35 beschriebenen Verfahren vervielfaltigt werden. Je nach Einsatzbereich konnen zur 
Vervielfaltigung der Logomere verschiedene Verfahren und verschiedene 
Aufarbeitungsprozesse vorgenommen werden. Zur Kennzeichnung petrochemischer 
Erzeugnisse z.B. konnen Logomere durch Klonierung in Bakterien vervielfaltigt werden. Urn 
unnotige Kontaminationen zu vermeiden, konnen die erhaltenen Bakterien lysiert werden. 

40 Eine spezielle Aufreinigung der Logomer-DNA ist im Allgemeinen nicht notig. 
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Zur Herstellung von Logomeren fur sensible und hochsensible Produkte ist dagegen ein 

aufwendigeres Vervielfaltigungs- und Aufreinigungsverfahren notig. Ziel ist dabei der Erhalt 
moglichst reiner Logomere. Urn biologische Zwischenschritte zu vermeiden, kann die 
Vervielfaltigung - wie erfindungsgemaG beschrieben - mit PCR vorgenommen werden. Sollte 
5 eine Vervielfaltigung durch Klonierung vorgenommen werden, so ist die Aufreinigung der 
erhaltenen DNA aus Bakterien notig. Sind die Logomere in bakteriellen Vektoren kloniert, so 
ist ein gezielter Abbau dieser Resistenzgene (z. B. durch Restriktionsenzyme) Bestandteil 
einer weiteren Aufarbeitung. 

10 Logomere konnen zur Kennzeichnung eines Produktes unmittelbar mit diesem verbunden 
werden. Sie konnen z.B. in fliissige Stoffe gemischt werden Oder auf feste Stoffe aufgebracht 
werden. Im Falle gentechnischer Erzeugnisse konnen die Logomere mithilfe von 
Rekombinations- und Klonierungstechniken kovalent mit dem zu kennzeichnenden Produkt 
verbunden werden. 

15 Die Kennzeichnung von Stoffen und Produkten durch Logomere ermoglichen u.a. das 
Monitoring von Produktionsprozessen, die Qualitatskontrolle, die Identifikation einzelner 
Bestandteile und den quantitativen und qualitativen Nachweis von Kontaminationen. 



Ein Aspekt der vorliegenden Erfindung wird im folgenden am Beispiel der Herstellung 
20 Computer-kompatibler Daten (Bytes/Multibytes) aus Nukleinsauren und ihrer Verwendung zur 
Markierung unterschiediicher Materialien erlautert, schrankt die Erfindung jedoch nicht auf 
dieses Beispiel ein: 



1 . Es wird eine Kodierung von Bytes und Multibytes in Form von Nukleinsauren definiert. 
25 2. Geeignete Sequenzen zur Representation von Bytes und Multibytes werden konstruiert. 

3. Eine Bibliothek (Library) von Byte-reprasentierenden Nukleinsauren wird in vitro 
hergestellt. 

4. Bytes werden zu Multibytes verknupft. 

5. Biochips werden zur Identifikation von Bytes und Multibytes hergestellt. 

30 6. Unterschiedliche (organische und anorganische) Materialien und Gegenstande sowie 
einzelne Gene werden mit Bytes Oder Multibytes gekennzeichnet (und ggfs. verschliisselt). 
7. Die Information gekennzeichneter Materialien, Gegenstande oder einzelner Gene wird 
ausgelesen (und ggfs. zu entschlusselt). 

35 Erlauterung zu 1 : 

Die Representation von Daten mit Nukleinsauren soil gewahrleisten, daf3 die Daten Computer- 
kompatibel sind. Zu diesem Zweck wird als universellste Darstellung von Computerdaten die 
Representation von Bytes und Multibytes gewahlt. 
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Dazu wird eine Grammatik G C3 2 definiert, G C32 = (2, V, R, S) mit Terminalalphabet £:= {x n , o m , 
s m , e m }, Variablenalphabet V:= {A, B, C}, Startsymbol S und Regelmenge R:={S:=oA, A— »s m B, 
B-^Ce m , C-»x n }, wobei n, m e IN, n = {0, 1 , .... 255 } und m > 0. Die Grammatik beschreibt die 
Konstruktion von Molekulen der Form osxe, wobei x aile Bytewert zwischen 0 und 255 

5 annehmen kann, s Bytepositionen beschreibt und o und e fur das Verketten von Einzelbytes 
zu Multibytes vorgesehen ist (siehe Abbildung 29 und Abbildung 30). Zur Vereinfachung des 
Herstellungsprozesses werden Restriktionssites als Variablen verwendet. 
AuBerdem mussen die verwendeten Nukleinsauren logische, physikalische, chemische und 
biologische Eigenschaften haben. Insbesondere mussen/sollen sie einfach zu vervielfaltigen, 

10 einfach zu lesen sein und auf definierte Weise mit biologischen Sequenzen interagieren. 
Zu diesem Zweck werden datenreprasentierende Nukleinsauren so definiert, daB 

a) sie Bytes darstellen 

b) auch komplexere Datenstrukturen (Multibytes) darstellen konnen 

c) einzelne Bytes zu Multibytes verknupft werden konnen 
15 d) sie mit einem Biochip gelesen werden konnen 

e) sie selbst zur Hersteliung von 1-Byte und Multibyte Biochips dienen konnen 

f) einzelne Bytes und Multibytes mit PCR vervielfaltigt werden konnen 

g) klonierbar sind 

h) mit anderen Nukleinsauren so verknupft werden konnen, daB sie diese markieren 
20 i) moglichst wenige Restriktionssites tragen 



a) Damit die datenreprasentierenden Nukleinsauren Bytes darstellen konnen, mussen genau 
256 eindeutige Sequenzen aile Werte eines Bytes reprasentieren. Dazu enthalten die 
molekularen Bytes eine eindeutige Sequenz x, von der es 256 verschiedene Allele gibt. 

25 Diese Allele werden als x 0 bis x 25 5 bezeichnet und enumerieren genau aile Bytewerte (x 0 = 

0, X1 = 1 x 255 = 255) (siehe Abbildung 25, Abbildung 26, Abbildung 27, Abbildung 28 

und Sequenzprotokoll). 

b) Urn komplexere Datenstrukturen (Multibytes) wie z.B. 32-Bit Zahlen und Strings darstellen 
zu konnen, werden die Bytemolekule so konstruiert, daB sie mit einer Positionsinformation 

30 versehen werde. Diese ist in Form der Sequenz s enthalten (siehe Abbildung 25, 

Abbildung 26, Abbildung 27, Abbildung 28 und Sequenzprotokoll). Jede Position ist durch 
eine eindeutige Sequenz Sj dargestellt. Mit den verschiedenen Allelen von s werden dann 
aile Bytepositionen enumeriert (s 0 = Position 0, St = Position 1, ... usw.). 

c) Obwohl es im Prinzip zur Darstellung von Multibytes ausreicht, die darzustellenden Daten 
35 auf unabhangige Bytes mit den entsprechenden Positionsinformationen zu verteilen (als 

mehrstrangige Multibytes: z.B. konnen, urn einen Lack mit einer 4 Byte langen 
Sertennummer zu versehen, 4 einzelne Bytes die jeweils genau eine Positionsinformation 
von s 0 bis s 3 besitzen unabhangig voneinander in den Lack gemischt werden), ist es 
manchmal zweckmaBig, Bytes direkt zu einstrangigen Multibytes zu verknupfen. Dazu 
40 tragen die Bytes die Sequenzen o und e (siehe Abbildung 25 bis Abbildung 28 und 

Sequenzprotokoll), mit denen sie sich durch Ligation oder overlap assembly und PCR zu 
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einstrangigen Multibytes verkniipfen lassen (siehe Abbildung 29 und Abbildung 30). Diese 
einstangigen Multibytes kSnnen dann ihrerseits ais Marker verwendet werden. Im Falle 
des parallel overlap assembly werden die einzelnen Bytes mit einem geeigneten 
Restriktionsenzym (hier: EcoRV siehe Abbildung 28) ausgeschnitten. 

d) Datenreprasentierende Nukleinsauren konnen z.B. mithilfe von Sequenzierern gelesen 
werden. Damit sie jedoch moglichst einfach und schnell gelesen werden konnen, ist 
insbesondere vorgesehen, sie mithilfe von Biochips zu lesen. Dazu werden Biochips 
hergestellt, die alle 256 verschiedenen x-Sequenzen einzelstrangig (und damit alle 
Bytewerte) aufsteigend geordnet enthalten (siehe Abbildung 32 und Abbildung 33). 
SolchermaSen hergestellte Biochips sind ebenfalls Gegenstand der vorliegenden 
Erfindung. Das Auslesen eines bestimmten Bytewertes x, erfolgt dann durch Denaturieren 
des entsprechenden Datenmolekuls zu Einzelstrangen und Hybridisieren mit dem Chip. 
Dabei werden die hybridisierten Sequenzen analog der typischen Funktionsweise von 
Biochips markiert, z.B. durch Fluoreszenzmarkierung. Nach dem Hybridisieren von 
Datenmolekul mit einem 1 -Byte Chip enthalt man dadurch genau eine markierte Position 
auf dem Biochip, die damit genau den Bytewert bezeichnet (siehe Abbildung 36). Z.B. 
hybridisiert das Datenmolekul, das die Sequenz x 192 tragt, genau an der Position 192 im 
Chip, und kann anhand der Position innerhalb des Chips identifiziert werden. 

e) Da das Prinzip des Auslesens von Datenmolekillen mithilfe des Biochips auf der 
Hybridisierung komplementarer Sequenzen beruht, werden die Bytes so konstruiert, daB 
sie gleichzeitig zur Herstellung der entsprechenden Biochips dienen konnen. Dazu tragen 
die Bytemolekule enzymatische Restriktionssites, so daB aus einem vollstandigen 
Bytemolekul entweder die x enthaltende Subsequenz Oder die s und x enthaltende 
Subsequenz ausgeschnitten werden konnen. Diese Subsequenzen werden dann 
denaturiert und auf einen Chiptrager gespottet. Urn einen 1-Byte Chip herzustellen werden 
alle 256 x-Sequenzen aufsteigend geordnet auf den Chip aufgetragen. Dadurch ist es 
moglich, eine Sequenz mit vorher unbekanntem x anhand iherer Hybridisierungsposition 
zu identifizieren. Verwendet man nur die x Subsequenz fur die Herstellung des 1-Byte 
Chips, so enthalt man als X-Chips bezeichnete Chips (siehe Abbildung 32), verwendet 
man die s und x enthaltende Subsequenz, so erhalt man die als SX-Chips bezeichnete 
Chips (siehe Abbildung 33). Sowohl X- als auch SX-Chips konnen auch zu Multibyte 
Chips kombiniert werden. Eine weitere Voraussetzung fur das Herstellen von Biochips ist 
die Verfugbarkeit ausreichender Mengen von Sequenzen. Dazu kann man die 
Bytemolekule entweder direkt mit Oligosynthesizern herstellen, sie klonieren oder aus 

35 wenigen Template-Molekulen mit PCR vervielfaltigen. 

f) Urn gezielt einzelne Bytes (z.B. aus einstrangigen Multibytes) zu vervielfaltigen, konnen 
die als o, s, und e bezeichneten Subsequenzen als priming sites dienen (siehe Abbildung 
25, Abbildung 26, Abbildung 27, Abbildung 28). 

g) Urn klonierbar zu sein tragen die Bytemolekule sticky ends die zu Restriktionssites 
40 kompatibel sind (z.B. Xhol und Xbal, siehe Abbildung 28). 
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h) Damit Bytes und Multibytes leichter mit beliebigen Nukleinsauren verkniipft werden 
konnen, konnen entweder durch Ligation oder durch overlap assembly und PCR weitere 
Terminatoren (Adaptoren) an Bytes und Multibytes angehangt werden (siehe Abbildung 
29 und Abbildung 30). Diese Adaptoren tragen dazu Restriktionssites Oder 
5 Rekombinationssites, so daB sie entweder durch Restriktion und Ligation oder durch 

Rekombination mit anderen Nukleinsauren verkniipft werden konnen. Dies ist 
insbesondere zur Kennzeichnung von Nukleinsauren, insbesondere Genen vorteilhaft. 
i) Im Zusammenhang mit der Verknupfung von Bytes und Multibytes mit anderen 
Nukleinsauren ist es vorteilhaft, daB insbesondere Multibytes nur wenige Restriktionssites 
10 tragen, damit der Verwender von Nukleinsauren die mit Bytes und Multibytes versehen 

sind, moglichst wie gewohnt damit arbeiten kann und moglichst auf keine Restriktionssites 
verzichten muB, die ansonsten die Bytes zerstoren. Daher sind die Bytes so konstruiert, 
daB nach der Herstellung von einstrangigen Multibytes von alien Restriktionssites, die auf 
Sequenzpalindromen der Lange 6 beruhen nur noch die Restriktionssites Aflll, Nhel und 
1 5 Ncol in den Multibytes enthalten sind und daher nicht ohne weiteres z.B. fur mit Multibytes 

markierte Nukleinsauren verwendet werden konnen. Ggfs. lassen sich sogar die noch 
verbleibenden Restriktionssites aus den Bytes und Multibytes entfernen ohne die Byte und 
Positionsinformationen zu verlieren, indem man Multibytes mit PCR und mutierten 
Primern so vervielfaltigt, daB die Restriktionssites blockiert werden. 
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Eriauterung zu 2: 

Die zur Implementierung benotigten Sequenzen werden mithilfe des bereits 
beschriebenen NFR-Verfahrens synthetisiert. Die Sequenzen sind so konstruiert, 
daB alle Sequenzen untereinander moglichst unahnlich sind. Die x-Subsequenzen 
haben einen GC-Anteil von 50%, die o-, s- und e-Sequenzen haben einen GC-Anteil 
von 66%, Multibytes enthalten 3 Sequenzpalindrome der Lange 6, die jeweils einmal 
von Aflll, Nhel und Ncol erkannt werden. 

Eriauterung zu 3: Die Bytemolekiile konnen direkt mit Hilfe eines Oligosynthesizers 
30 hergestellt werden. Urn groBere Mengen von Bytemolekiilen herzustellen ist es 
jedoch oft zweckmaBig, eine Klonbibliothek anzulegen, die alle Bytemolekiile enthalt. 
Eriauterung zu 4: Bytes konnen aufgrund der enthaltenen Bytepositionsinformation 
auch ohne direkt miteinander verkniipft zu werden Multibytes darstellen (logische 
Verknupfung zu mehrstrangigen Multibytes). Es ist jedoch fur einige Anwendungen, 
z.B. die Kennzeichnung von Nukleinsaurestrangen zweckmaBig, die einzelnen Bytes 
auch physikalisch zu einem Multibyte zu verkniipfen (einstrangiges Multibyte, siehe 
Abbildung 30 und Abbildung 31). Dazu werden die einzelnen Bytes entweder durch 
Ligation oder durch overlap assembly und PCR miteinander verkniipft. 
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Erlauterung zu 5: Biochips zum Lesen von Bytes und Multibytes werden mit 
Untereinheiten der Molekule hergestellt, die als Bytes fungieren. Grundsatzlich gibt 
es zumindest 2 Architekturen: den X-Chip (siehe Abbildung 32), der mit x- 
Subsequenzen (siehe Abbildung 25 bis Abbildung 28) und den SX-Chip (siehe Abbildung 
33), der mit sx-Subsequenzen (siehe Abbildung 25 bis Abbildung 28) hergestellt wird. 
Beide Chips sind 1-Byte Chips und konnen zu Multibyte Chips kombiniert werden. 
Die prinzipielle Funktionsweise ist ahnlich: Das Auslesen der Information von 
Datenmolekiilen erfolgt durch Hybridisieren mit dem Chip. Anhand der 
Hybridisierungsposition des Datenmolekuls laBt sich sein Bytewert ablesen. 
Dadurch wird es auch moglich, Multibyte Chips als Datenspeicher (ROM und RAM) 
zu verwenden: Das Hybridisieren des Chips mit einem spezifischen Datenmolekul 
entspricht dem Zuweisen eines Wertes an eine Speicherzelle. Durch Denaturieren 
(z.B. uber Temperaturerhohung oder pH-Wert Anderung) wird die Speicherzelle 
wieder geloscht. Dariiber hinaus konnen spezifische Sequenzen die mit dem Chip 
hybridisiert werden auch mit optisch aktiven Molekulen unterschiedlicher Farbe 
versehen werden, so da(3 sich auch gezielt Farbmuster erzeugen lassen, so daf3 sich 
Multibyte Chips auch als Display verwenden lassen. Kombiniert man Sequenzen 
unterschiedlicher Schmelztemperatur mit optisch aktiven Molekulen verschiedener 
Farbe, so kann auch eine Farbanzeige im Sinne eines Thermometers erfolgen. 
Der Unterschied zwischen X-Chip und SX-Chip besteht darin, daf3 der SX-Chip 
zusatzlich zum Bytewert auch die Byteposition lesen (und speichern) kann. Vorteil 
des X-Chip ist, daf3 man sehr groGe Multibyte-Arrays aus identischen X-Chips 
herstelien kann. Vorteil des SX-Chips ist, daG sich damit einstrangige Multibyte- 
Molekiile lesen lassen, ohne da3 man die einzelnen Bytes getrennt voneinander 
hybridisieren muBte. 



Erlauterung zu 6: Uber die Adaptoren L und R (siehe Abbildung 29 und Abbildung 30) 
lassen sich Sequenzen mit Bytes und Multibytes verbinden, die dazu dienen, diese 
mit Nukleinsauren zu verbinden. Dazu enthalten die Adaptoren z.B. geeignete 
Restriktionssites oder Rekombinationssites. Z.B. Ia3t sich das ein Multibyte mithilfe 
von geeigneten Restriktionssites in einem Plasmid klonieren, wodurch dieses 
Plasmid eine Kennzeichnung erhalt. Diese kann z.B. in einer 32-Bit Seriennummer 
bestehen (siehe Abbildung 31). Ein anderes Anwendungsbeispiel ist das Anbringen 
von Rekombinstionssites an ein Datenmolekul, wodurch dieses z.B. in nicht- 
kodierende Regionen (z.B. Introns) von Genen eingebracht werden kann, wodurch 
diese gekennzeichnet werden. 
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Erlauterung zu 7: Die Information von Materialien, Gegenstanden und Molekiilen, die 
mit Datenmolekulen gekennzeichnet wurden lassen sich dadurch auslesen, daB man 
sie aus dem gekennzeichneten Material extrahiert, ggfs. aufreinigt, ggfs. mit PCR 
5 amplifiziert und dann entweder sequenziert oder durch Hybridisieren mit einem Byte- 
oder Multibyte-Chip wie oben identifiziert. 

Die oben beschriebenen Verfahren ermoglichen somit die eindeutige Kennzeichnung 
von organischen und anorganischen Materialien und Gegenstanden sowie von 
10 Nukleinsaure-Konstrukten und Genen. 

Die oben beschriebenen Verfahren ermoglichen auBerdem die Herstellung von 
Datenspeichern und optischen Displays: Zum Zwecke der Speicherung von 
Computerdaten werden Multibyte-Arrays verwendet. Das Schreiben eines einzelnen 
15 Byte erfolgt durch das Hybridisieren eines 1-Byte Chips mit einer (ggfs. optisch 
markierten) Nukleinsaure, die genau einmal eine definierte x-Sequenz enthalt, die 
dem zu schreibenden Wert entspricht (z.B. x n92 ). Das Auslesen der Daten erfolgt 
analog dem Auslesen biologischer DNA-Arrays, z.B. durch Scannen. Das Loschen 
von Daten erfolgt durch Denaturieren und ggfs. nachtragliches Waschen. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung 
einzelner Molekule, Nukleinsauren und gentechnisch hergestellter Oder veranderter 
Erzeugnisse: 



Die hier beschriebenen Logomere konnen zur Kennzeichnung gentechnisch hergestellter oder 
veranderter Erzeugnisse verwendet werden. 

Bisher werden insbesondere zur Identifikation gentechnisch hergestellter oder veranderter 
Erzeugnisse in Nahrungsmittein "klassische" molekularbiologische Methoden wie PCR, 
30 Restriktionsverdau, Southernblot-Hybridisierung und Sequenzierung verwendet. Mit diesen 
Methoden ist jedoch eine Charakterisierung gentechnischer Erzeugnisse und Bestandteile 
noch sehr aufwendig und erfordert fur jedes zu charakterisierende Erzeugnis eigene 
Methoden und Verfahren. 

Insgesamt gibt es bisher kein universelles Kennzeichnungsverfahren fur gentechnisch 
35 hergestellte Erzeugnisse. Ein solches Kennzeichnungsverfahren muB mehrere Kriterien 
erfullen: 

- die Kennzeichnung muB gesundheitlich absolut unbedenklich sein, 

- die Kennzeichnung sollte untrennbar mit dem gekennzeichneten Produkt verbunden sein, 

- die Kennzeichnung sollte falschungssicher sein, 
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- die Kennzeichnung sollte geniigend Informationen speichern konnen, 

- die Kennzeichnung sollte in geringen Mengen nachweisbar und lesbar sein. 

Der Einsatz nukleinsaurebasierter Logomere zur Kennzeichnung gentechnischer Erzeugnisse 
erfullt diese Kriterien und hat daruber hinaus folgende Vorzuge: 
5 - Logomere konnen nahezu beliebige Informationen speichern; 

- einzelne Bestandteile konnen schnell und hochempfindlich nachgewiesen werden; 

- zum Auslesen der Informationen kann eine bis ins Detail standardisierte Methode 
eingesetzt werden (Ausleseverfahren nach dem erfindungsgemaBen Verfahrens, dabei 
konnen standardisierte Primer verwendet werden); 

10 - die Sequenz der gesuchten Gene kann vollkommen unbekannt sein; 

- die Sequenz der nachgewiesenen Gene kann geheim sein, ohne daB die Identifizierung 
Oder Authentifizierung eingeschrankt ist; 

- zusatzliche Sicherheitsmechanismen konnen zusatzlich durch Verschlusselung 
implementiert werden. 

15 

lm Einzelnen geht man zur Kennzeichnung von gentechnisch erzeugten Oder veranderten 
Erzeugnissen beispielsweise folgendermaBen vor: 

Zur Herstellung von Markern wird eine beliebige geeignete Grammatik, z.B. wie die fur den 
Zufallszahlengenerator, das 1-Byte Alphabet Oder fur Zeichenketten bereits beschriebene, 
verwendet. Aus den mit der Grammatik erzeugten Zeichen werden die zur Darstellung von 
Markern benotigten Zeichen entnommen und dem zu kennzeichnenden Erzeugnis 
hinzugefugt. Dazu konnen die als Logomere hergestellten Zeichen auf folgende Weise in das 
zu kennzeichnende Erzeugnis eingebracht werden: 

a) durch Beimischung; hierbei werden Logomere, wie in den erfindungsgemaBen Verfahren 
25 beschrieben, hergestellt, isoliert und vervielfaltigt. 

b) durch Klonierung, wie im erfindungsgemaBen Verfahren beschrieben; Abbildung 6 zeigt 
z.B. die Kennzeichnung bakterieller Klone durch Logomere, die durch Verwendung der 
bereits beschriebenen Grammatik fur den Zufallszahlengenerator hergestellt wurden. 

c) durch Restriktion und Ligation; hierbei werden Logomere erfindungsgemaB hergestellt, 
isoliert und vervielfaltigt. Die solcherart gewonnenen Logomere werden jetzt durch 
Restriktion und Ligation mit der zu kennzeichnenden Nukleinsaure verbunden. Dazu 
konnen die oben beschriebenen Terminatoren (siehe Abbildung 2) und Adaptoren (siehe 
Abbildung 30) gewiinschte Restriktionssites tragen. 

d) durch den Einsatz rekombinativer Techniken; hierbei werden Logomere erfindungsgemaB 
hergestellt, isoliert und vervielfaltigt. Die solcherart gewonnenen Logomere werden jetzt 
durch den Einsatz rekombinativer Techniken in das zu kennzeichnende Erzeugnis 
eingebracht. Dazu kann z. B. die Methoden des Gene-Targeting durch homologe 
Rekombination [Capecchi M.R., Altering the genome by homologous recombination. 
Science, 244(4910), 1288-1292, (1989)] oder z.B. das Cre-loxP System [Kilby, N. J., 
Snaith, M. R. & Murray. J. A., Site-specific recombinases: tools for genome engineering 
Trends Genet, 9, 413-421, (1993)] verwendet werden. Z.B. konnen erfindungsgemaB 
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erhaltene Logomere mit Hilfe dieser Techniken vor Oder hinter eine bestimmte 
Nukleinsauresequenz (Gen) gesetzt werden, die sie bezeichnen sollen. In diesem Falle 
wird ein Logomer gewissermaGen als "Etikett" an ein gentechnisches Produkt 
"angeheftet" und kann Auskunft uber Hersteller, Produktgruppe, Gefahrenklasse, 
5 Verfallsdatum o.a. geben (siehe Abbildung 15). 

Das Verfahren eigent sich insbesondere zur Kennzeichnung einzelner Molekule, insbesondere 
einzelner Nukieinsauren, besonders bevorzugt einzelner Gene. 

Das Verfahren eignet sich z.B. fur alle Organismen (Mikroorganismen, Pflanzen, Tiere). Z.B. 
10 lassen sich Klone von Mikroorganismen Oder Pflanzen kennzeichnen. Das Verfahren eignet 
sich auch fur die Kennzeichnung von Lebensmitteln und fur die Kennzeichnung von Rindern 
zur Bekampfung der Rinderseuche BSE. 



15 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung 
von Nahrungsmitteln 

Aufgrund von Krankheiten, Seuchen Oder Kontaminationen konnen Nahrungsmittel 
gesundheitsschadlich Oder gefahrlich sein. Beispiele sind Krankheiten wie BSE, 
20 Schweinepest, Salmonellenvergiftungen. Es kann wunschenswert sein, Produkt und Hersteller 
identifizieren zu konnen, um notfalls bestimmte Produkte und Produktreihen umgehend aus 
dem Handel zu nehmen, untersuchen zu konnen und geeignete GegenmaBnahmen zu 
ergreifen. 

Fur hochsensible Erzeugnisse wie Nahrungsmittel gelten dabei die Kriterien fur die 
25 Kennzeichnung gentechnischer Erzeugnisse insbesondere (siehe: Die oben beschriebenen 
Verfahren ermoglichen beispielsweise die Kennzeichnung einzelner Molekule, Nukieinsauren 
und gentechnisch hergestellter oder veranderter Erzeugnisse). 

Insgesamt gibt es auch fur gentechnisch hergestellte Nahrungsmittel bisher kein universelles 
Kennzeichnungsverfahren. Bisher ist die Identifikation gentechnisch hergestellter oder 
30 veranderter Bestandteile in Nahrungsmitteln daher noch schwierig und aufwendig. Es werden 
dazu "klassische" molekularbioiogische Methoden wie PCR, Restriktionsverdau, Southernblot- 
Hybridisierung und Sequenzierung verwendet, um diese Erzeugnisse zu charakterisieren. 
Aufgrund der Rinderseuche BSE wurde speziell fur die Kennzeichnung von Rindern und deren 
Produkten (Rindfleisch und Milch) ein immunologisches Kennzeichnungsverfahren 

35 vorgeschlagen, das auf der Immunisierung der zu markierenden Tiere mit spezifischen 
Proteinen basiert ("Ohrmarke im Blut soli BSE Rinder aufspuren", Suddeutsche Zeitung Nr. 
283, 08.12.1998, Seite v2/9). Durch die dadurch verursachte Produktion spezifischer 
Antikorper im jeweils gekennzeichneten Zieltier, die mutmaBlich in alien Geweben 
nachzuweisen ist, kann die Kennzeichnung uber einen Immun-Assay (ELISA) wieder gelesen 

40 werden. Ein solches Verfahren ist jedoch prinzipiell auf hohere Wirbeltiere beschrankt. 
AufBerdem ist die fur das Verfahren verfugbare informationsmenge sehr begrenzt, die 
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informationstragenden Proteine sind nicht hitzebestandig und das Verfahren erfordert 
vergleichsweise hohe Mengen Substanz fur Immunisierung und Nachweisreaktion. 

Auch im Fall von Nahrungsmitteln konnen Logomere auf Nukleinsaurebasis, wie bereits unter 
5 Die oben beschriebenen Verfahren ermoglichen beispieisweise die Kennzeichnung einzefner 
Molekule, NukJeinsauren unci gentechnisch hergestellter Oder veranderter Erzeugnisse 
beschrieben, zur Kennzeichnung eingesetzt werden. Logomere konnen dabei Informationen 
iiber Hersteller, Verfallsdatum, Seriennummer u.a. enthalten. Das Verfahren zur 
Kennzeichnung von Nahrungsmitteln ist dabei dasselbe, wie bereits unter Die oben 

10 beschriebenen Verfahren ermoglichen beispieisweise die Kennzeichnung einzelner Molekule, 
Nukleinsauren und gentechnisch hergestellter oder veranderter Erzeugnisse 
beschrieben. Mithilfe der dort aufgefuhrten gentechnischen Rekombinations- und 
Klonierungstechniken konnen einzelne Organismen gekennzeichnet werden, sodafB ein 
einzelner Organismus sowie alle seine Nachfahren identifizierbar sind. 

15 Das Kennzeichnungsverfahren durch Logomere ermoglicht dadurch: 



ein Monitoring des Zielproduktes uber den gesamten Herstellungs- und 
Verarbeitungsprozesses bis zum Endverbraucher, 

eine einheitliche, schnelle und einfache Identifikation einzelner Bestandteile. 



20 Als Beimischung eignen sich Logomere auf Nukleinsaurebasis zur Kennzeichnung von 
Getranken. 



Die oben beschriebenen Verfahren ermoglichen beispieisweise die Kennzeichnung 
25 medizinischer und pharmazeutischer Produkte 

Aufgrund der Nichttoxizitat eignen sich Logomere auf Nukleinsaurebasis zur Kennzeichnung 
sensibler und hochsensibler Erzeugnisse. Neben Nahrungsmitteln sind dies auch 
medizinische und pharmazeutische Produkte. Urn Verwechselungen, Kontaminationen und 
30 Falschungen ausschlieBen zu konnen, konnen Logomere z.B. medizinischen und 
pharmazeutischen Produkten beigemischt werden. 

Der Vorteil der Kennzeichnung durch Logomere ist dabei, daB die Kennzeichnung unmittelbar 
mit dem gekennzeichneten Erzeugnis verbunden ist und daB sich Erzeugnisse z.B. individuell 
kennzeichnen lassen. Auf diese Weise ist ein Monitoring des Herstellungsprozesses mdglich, 
35 Erzeugnisse lassen sich auch nach mehrmaligem Umfullen eindeutig identifizieren und 
Kontaminationen sowie das Poolen von Proben konnen nachgewiesen werden. Mithilfe von 
Logomeren laBt sich z.B. im Falle von Blutkonserven Herstellungs- und Verfallsdatum, 
Blutgruppe und Hersteller kennzeichnen. 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise Authentifizierung und 
Falschungssicherung 

Logomere konnen zur Authentifizierung von Erzeugnissen, Gegenstanden und Geraten 
5 verwendet werden. Dazu werden Logomere vorzugsweise erfindungsgemaB erzeugt und 
vervielfaltigt. 

Werden solcherart erhaltene Logomere auf Erzeugnisse, Gegenstande und Gerate an-/ 
aufgebracht Oder zugemischt, so konnen die in Logomeren enthaltenen erfindungsgemaB 
jederzeit wieder ausgelesen werden. Sollten zur Erzeugung der Logomere 
10 Verschlusselungstechniken verwendet werden, wie bereits beschrieben, so erfordert das 
Auslesen autorisierten Zugriff. 

Beispielsweise konnen erfindungsgemaB erhaltene Logomere in wassriger Losung 
(vorzugsweise zu 10 3 bis 10 18 Molekulen//yl) unmittelbar zur Kennzeichnung auf Dokumente 
aufgebracht werden. Als solches konnen sie als Echtheitszertifikat des solcherart markierten 

15 Dokumentes dienen. Zum Auslesen der als Kennzeichner dienenden Logomere wird einfach 
ein kleines Schnipsel des Papiers (1mm 2 ist ausreichend) als Template einer 
erfindungsgemaBen PCR-Auslesereaktion verwendet. Ein Beispiel findet sich in Abbildung 16. 
In dem zugrundeliegenden Ausleseexperiment wurde zum Test des Prinzips ein Logomer in 
wassriger Losung in ca. 10 9 Molekulen///l auf 3M Postlt Papier ca. 1 Stunde getrocknet und 

20 1mm 2 des Post-Its als Template einer Auslese-PCR verwendet. Es konnen Dokumente 
beliebiger Papierqualitat verwendet werden, z.B. 80g/m a Standardkopierpapier. 
Dasselbe Verfahren eignet sich auch zur Kennzeichnung von Geld oder Geldscheinen, wobei 
hier Vorteile darin bestehen, 

auch bereits gedruckte Scheine markieren zu konnen, 

25 - Seriennummern vergeben zu konnen, 
Verschlusselung einzusetzen. 

Urn Dokumente moglichst in Echtzeit auf Authentizitat prufen zu konnen, kann einer der zum 
Auslesen in der PCR benutzten Primer auch als Hybridisierungsonde fur eine nachfolgende 
30 Farbe-Nachweisreaktion (z.B. mit einem interkalierenden Farbstoff, z.B. Ethidiumbromid) 
verwendet werden. 

Ein weiteres Beispiel ist die Authentifizierung flussiger Losungen, Suspensionen und 

Emulsionen mit Logomeren. So kann etwa Tinte mit Logomeren individuell markiert werden, 

so daB Unterschriften damit auf Echtheit iiberpruft werden konnen. 
35 Ein weiteres Beispiel ist die Kennzeichnung von Automobilen durch das Versetzen des 

Autolackes mit Logomeren. Dabei werden Logomere dem Autolack (oder anderen 
Bestandteilen des KFZ) als Beimischung zugesetzt. Die zugesetzten Logomere konnen dabei 
Informationen uber Seriennummer, Hersteller, Fahrzeugtyp o.a. Angaben enthalten. Aufgrund 
dieser Informationen kann im Falle von Unfall, Diebstahl oder illegaler Entsorgung ein 
40 Fahrzeug identifiziert werden. Ein Vorteil der hier beschriebenen Methode liegt darin, daB 
schon Lackspuren zur Identifikation des Fahrzeuges ausreichen, was insbesondere bei 
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Unfallen von Interesse sein kann. Ein weiterer Vorteil ist, daB die Identitat eines Fahrzeuges 
nur sehr aufwendig zu falschen ist. Dazu muBten erstens alle gekennzeichneten Bestandteile 
entfernt, zweitens eine gefalschte Identitat eingerichtet werden. Dieses Unterfangen ist alleine 
durch den mechanischen Aufwand sehr schwierig, auBerdem laBt sich durch den Einsatz 
kryptografischer Methoden das Nachmachen und Nachahmen von Kennungen beliebig 
erschweren. Zum Auslesen der als Logomere enthaltenen Informationen, werden die 
Logomere aus dem Lack isoliert und konnen dann wie in der Beschreibung zum Auslesen der 
in Logomeren enthaltenen Information, vorzugsweise durch PCR, ausgelesen werden. Dazu 
wird eine Probe des Lackes entnommen, mit einem geeigneten Losungsmittel (Terpentin o.a.) 
gelost und mit gleichem Volumen Wasser versetzt. Durch nachfolgende Zentrifugation werden 
hydrophile und hydrophobe Bestandteile getrennt. Daraufhin nimmt man die wassrige Phase 
auf (worin sich die hydrophilen nukleinsaurebasierten Logomere befinden) und fallt die 
enthaltenen Logomere nach den iiblichen Methoden (z.B. wie in [J. Sambrook, E. F. Fritsch, 
T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). Nach der Fallung 
konnen die erhaltenen Logomere nach den erfindungsgemaBen Verfahren, z.B. durch 
Auslese-PCR, ausgelesen werden. 

Daher sind weitere Gegenstande der vorliegenden Erfindung die Verwendungen 
informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
informationstragenden Polymere, zum Zwecke der Qualitatssicherung, der 
Falschungssicherung, der Kennzeichnung von Lebensmitteln. der Kennzeichnung 
gentechnischer, chemischer, medizinischer und pharmazeutischer Erzeugnisse, der 
Kennzeichnung von Organismen, der Kennzeichnung von Dokumenten, der Kennzeichnung 
von Geld, der Kennzeichnung von Gegenstanden und Maschinen, der Kennzeichnung von 
Losungen, Suspensionen und Emulsionen sowie der Authentifizierung von Personen und 
Gegenstanden. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung von 
Molekulargewichtsstandards 

Zu den typischen Verfahren der molekularbiologischen Analytik gehort die elektrophoretische 
Langenauftrennung von DNA- und RNA-Fragmenten. Urn die Lange solcher Fragmenten bei 
der Elektrophorese zu bestimmen, verwendet man ublicherweise einen 
Molekulargewichtsstandard ("Letter"), der Fragmente bekannter Lange enthalt und zum 
Vergleich mit den Fragmenten der zu analysierenden Proben dient. 

Bisher gibt es Molekulargewichtsstandards, die entweder unregelmaBige Leitern enthalten 
(z.B. Boehringer V, Boehringer Mannheim, Katalog Nr.: 821 705) oder regelmaBige Leitern mit 
regelmaBigen Fragment-Langenabstanden (z.B. 50bp Leiter Gibco BRL, Life Technologies 
Katalog Nr. 10416-014). Keine der bisherigen Leitern hat dabei kurzere Langenabstande als 
10bp (z.B. 10bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10821-015). 
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Mit den hier beschriebenen Verfahren konnen gezielt DNA Fragmente verschiedener Lange 
und definierter Langenabstande hergestellt werden. Diese Fragmente konnen als 
Molekulargewichtsstandards genutzt werden, wobei das Verfahren erlaubt, prinzipiell beliebige 
Langen und beliebige Langenabstande zu realisieren. Insbesondere sind Langenabstande bis 
5 hinab zu 1bp Abstand, also Molekulargewichtsstandards hochster Auflosung, moglich. 

Das Verfahren beruht darauf, Logomere als Template einer Auslese-PCR zu verwenden, 
deren Resultat ein Gemisch von DNA Fragmenten definierter Lange und definierter 
Langenabstande ist. Es basiert auf den bereits beschriebenen erfindungsgemaBen Verfahren 
zur Erzeugung und dem Auslesen von Logomeren. 
10 DNA Fragmente verschiedener Lange in sehr kurzen, regeimaBigen Abstanden konnen 
erhalten werden, wenn ein unares Polymer als Template einer Auslese-PCR mit 
verschachteiten Primern fungiert. Der S'-Primer primt in der Start-Sequenz des Polymers. Als 
gegenlaufige 3' Primer fungiert eine Gruppe von Primern, die verschachtelt in dem Elongator 
ansetzt (in Abbildung 17 dargestellt als 3 Ebenen gegeneinander versetzter Primer). Da das 
15 Polymer aus Wiederholungen nur eines Elongator-Molekuls besteht, erhalt man fur n 
Wiederholungen und m verschachtelte 3' Primer n*m Banden. Das Verfahren funktioniert 
auch spiegelbildlich mit einem im Ende-Terminator primenden Primer und dementsprechen 
gegenlaufigen 5' Primern. Die erhaltenen Banden konnen als Molekulargewichtsstandards 
z.B. in Elektrophoresen eingesetzt werden. 



Fur hochauflosende Molekulargewichtsstandards ist die Verwendung unarer Logomere und 
verschachtelter Primer am zweckmaBigsten. Jedoch ist das Verfahren nicht darauf 
beschrankt, da im Prinzip alle im erfindungsgemaBen Schritt I beschriebenen Grammatiken 
verwendet werden konnen. 
25 Unare Logomere beliebiger Lange konnen mit einer Grammatik G = (2, V, R, S) mit 
Terminalalphabet X:= {0, s, e}, Variablenmenge V:={A}, Startsymbol S und Regelmenge 
R:= 
{ 



hergestellt werden. Sollte es notig sein, unare Logomere definierter Lange herzustellen, muB 
dementsprechend die Variablenmenge und dam it auch die Zahl der Elongatoren groBer 
35 gewahlt werden (wie z.B. in der Grammatik zur Implementierung eines 1-Byte Alphabets 
bereits beschrieben). Je nach gewunschter Lange der zu erzeugenden DNA Fragmente kann 
auBerdem die Lange der Algomere variiert werden. 

Die so erzeugten Logomere konnen nach den erfindungsgemaBen Verfahren vereinzelt und 
vervielfaltigt werden. 

40 Das Erzeugen von DNA-Fragmenten definierter Lange und definierter Langenabstande erfolgt 
vorzugsweise mit PCR analog dem erfindungsgemaBen Verfahren zum Auslesen von 
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S:=sA 
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A->aA 



A->e 
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Logomeren. Fur hochaufldsende Molekulargewichtsstandards wird pro Elongator mindestens 
ein Primer, meistens sogar eine Anzahl mehrerer Primer verwendet, die gegeneinander 
verschoben sind. Die Anzahl der Primer pro Elongator ist abhangig von den gewunschten 
Langenabstanden. Ist etwa gewunscht, Algomere der Lange 30bp zu verwenden und sollen 
5 die Langen der erzeugten DNA Fragmente jeweils 10bp Unterschied haben, so sind pro 
Elongator drei Primer, die jeweils genau 10bp gegeneinander verschoben sind, eingesetzt 
werden. 

Fur die Synthese von Sequenzen zur Herstellung von Algomeren und Logomeren mussen die 
Anforderungen erfullt werden, die bereits unter Schritt II des erfindungsgemaBen Verfahrens 

10 beschrieben wurden. Insbesondere gewahrleistet das verwendete NFR-Verfahren dadurch, 
daB die jeweils als Template dienenden Teilsequenzen einen gleichen GC-Anteil besitzen 
konnen, den Einsatz verschachtelter Primer und die Ausgewogenheit des AT/GC 
Verhaltnisses der erzeugten DNA Fragmente. Letzteres ist insbesondere angesichts dessen 
entscheidend, daB das Laufverhalten von DNA Fragmenten in der Elektrophorese nicht nur 

15 von der Lange, sondern auch von der Zusammensetzung der Fragmente abhangt. Dies gilt 
insbesondere fur hochauflosende Molekulargewichtsstandards in denen es nur sehr geringe 
Langenabstande gibt. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
20 informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
informationstragenden Polymere, zur Herstellung von Molekulargewichtsstandards. 



Die oben beschriebenen Verfahren ermdglichen beispielsweise die Herstellung 
25 polymerer Datenspeicher 

Die beschriebenen Logomere konnen als RAM (Lesen und Schreiben) und ROM (nur Lesen) 
Datenspeicher hoher Kapazitat und niedrigen Energieverbrauchs genutzt werden. Urn eine 
moglichst hohe Informationsdichte zu gewahrleisten und die Handhabung des Speichers 
30 moglichst einfach zu machen, werden die Logomere an einen festen Trager gebunden. Dies 
gewahrleistet, daB die Logomere einzeln adressiert, d.h. einzeln geschrieben, gelesen und 
geloscht werden k6nnen (siehe Abbildung 9). 

Die benotigten Schreib- und Leseoperationen werden auf der Basis der im 
erfindungsgemaBen Schritt V und der unter Auslesen der in Logomeren enthaltenen 
35 Information beschriebenen enzymatischen Reaktionen durchgefuhrt, die ihrerseits durch 
Temperaturanderungen gesteuert werden. Die Temperaturanderungen konnen entweder per 
Laser Oder durch Erhitzen und Abkuhlen des festen Tragers z.B. in einem Thermozykler 
durchgefuhrt werden. 

Zum Schreiben wird eine Modifikation des oben beschriebenen Verfahrens der 
40 Symbolpolymerisation verwendet. Die Polymerisation findet an einem festen Trager statt, die 
Algomere werden durch wiederholte Restriktions-Ligationszyklen miteinander verkettet. 
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Urn einzelne, adressierbare Speicherzellen herzustellen, werden in bestimmten Abstanden 
einzelstrangige "Ankermolekiile" irreversibel (durch UV-Bestrahlung oder im Ofen) an den 
Trager gebunden. Der solcherart mit Ankermolekulen versehene Trager kann nun reversibel 
mit Logomeren beschrieben werden, die in einem Loschvorgang wieder davon entfernt 

5 werden konnen. 

Bei einem Schreibvorgang werden zuerst spezifische Algomere CStarter-Algomere") durch 
Hybridisierung an die Ankermolekiile gebunden. Diese Starter-Algomere sind ihrerseits 
Ausgangspunkt einer Symbolpolymerisation, bei der weitere Algomere miteinander verkettet 
werden. Die Verkettung der Algomere erfolgt dabei, abweichend von dem im Schritt V des 
10 erfindungsgemaBen Verfahrens beschriebenen Vorgehen, durch wiederholte Zyklen von 
Restriktion und Ligation. Bei jedem Zyklus wird das jeweils letzte Algomer einer 
polymerisierenden Kette mit einem Restriktionsenzym geschnitten, so daB eine 
einzelstrangige Oberhangsequenz (Elongationspunkt) entsteht, an die seinerseits das 
nachstfolgende Algomer durch Ligation gebunden werden kann. 

15 

Fur den solcherart beschriebenen Schreibvorgang mussen die Algomere ein spezifisches 
Design aufweisen: 

a) Jedes zu schreibende Algomer besitzt eine einzelstrangige Oberhangsequenz, mit der es 
an den Elongationspunkt eines Logomers binden kann. 
20 b) Ein Algomer, das nur eine einzelstrangige Oberhangsequenz besitzt mit der es an einen 
Elongationspunkt binden kann, selbst aber keine Restriktionsschnittstelle besitzt, durch 
die es von Restriktionsenzymen erkannt werden kann und damit nicht als 
Elongationspunkt dienen kann, heiBt Ende-Algomer. 

c) Jedes zu schreibende Algomer, das nicht das Ende-Algomer ist, besitzt ein 
25 doppelstrangiges Ende, worin sich die Erkennungssequenz fur das jeweils gewahlte 

Restriktionsenzym befindet. Bet einer Restriktion spaltet das Enzym das Algomer, so daB 
eine einzelstrangige Oberhangsequenz entsteht, die ihrerseits selbst wieder als 
Elongationspunkt dienen kann. 

d) Jedes fertige Logomer besitzt genau ein Starter- und ein Ende-Algomer. Starter- und 
30 Ende-Algomere sind, entsprechend der oben gegebenen Definition, Terminatoren. 

e) Die Uberhangsequenzen der Algomere sind kompatibel zu einem jeweils gewahlten 
Restriktionsenzym, so daB ein zu verkettendes Algomer an den Elongationspunkt eines 
Logomers binden kann und der nachfolgend durch Restriktion entstehende 
Elongationspunkt identisch zu seinem Vorlaufer ist. 

35 f) Die im Algomer auf die Oberhangsequenz folgende Sequenz ist solcherart gewahlt, daB 
ein verkettetes Algomer durch einen nachfolgenden Restriktionsvorgang nicht wieder 
abgespalten werden kann. 



Als fester Trager eignen sich Membranen wie Gene Screen Plus (DuPont, Biotechnology 
Systems, Katalog Nr.: NEF-986 oder NEF-987), Hybond-N (Amersham Life Sciences, Katalog 
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Nr.: RPN 82N oder RPN 137N), Silizium-, Silicat-Oberflachen Oder Glas. Die Ankermolekule 
werden jeweils kovalent daran gebunden (UV-Bestrahlung oder Hitze). 
Damit die Molekule einzeln adressierbar sind, mussen sie in regelmaBigen Abstanden auf 
dem Trager angebracht werden. 

Als Restriktionsenzyme eignen sich handesubliche Enzyme, vorzugsweise solche, die nicht 
bei 65°C deaktiviert werden (z.B. Hindlll). 

Die Schreiboperationen basieren darauf, daB die zum Schreiben verwendeten Enzyme 
unterschiedliche Temperaturoptima haben. So liegt das Temperaturoptimum der zum 
Verketten von Symbolen verwendeten Ligase bei 16°C, wohingegen die benotigten 
Restr,kt,onsenzy m e nur bei 37°C funktionieren. Dadurch ist das getaktete Schreiben von 
Symbolen in Zyklen von Restriktion und Ligation moglich. 

Da alle Lese- und Schreiboperationen mithilfe von Enzymen durchgefuhrt werden, ist es notig 
den Trager temperieren zu konnen. Dabei konnen, bei der Verwendung eines Thermozyklers 
und thermomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation 
unterworfen werden. Alternativ konnen Speicherzellen einzeln und unabhangig voneinander 
zugegnffen werden, wenn ein entsprechend kleiner Schreib-ZLesekopf eingesetzt wird Dieser 
Schreib-ZLesekopf muB einerseits als Pipettiervorrichtung fur die benotigten Molekule 
(Enzyme, Algomere) dienen und andererseits die fur eine bestimmte Manipulation benotigte 
Temperatur erzeugen (z.B. mit Hilfe eines Lasers). 

Beim Loschvorgang wird ein Logomer durch Denaturierung vom jeweiligen Ankermolekul 
gelost. Das Ankermolekul steht danach wieder fur einen Schreibvorgang zur Verftigung Fur 
einen Lesevorgang wird ein Logomer durch Denaturierung von einem Ankermolekul gelost. 
Es kann dann nach den erfindungsgemaBen Verfahren ausgelesen werden. 
Die beschriebenen Operationen Schreiben, Loschen, Lesen werden durch Enzyme bei 
verschiedenen Temperaturen durchgefuhrt. Dabei konnen, bei der Verwendung eines 
thermomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation 
unterworfen werden. Alternativ konnen Speicherzellen einzeln und unabhangig voneinander 
zugegnffen werden, wenn ein entsprechend kleiner Schreib-ZLesekopf eingesetzt wird Dieser 
Schreib-ZLesekopf muB einerseits als Pipettiervorrichtung dienen und andererseits die fur eine 
bestimmte Manipulation benotigte Temperatur erzeugen. 

Der Vorteil des hier vorgestellten Polymerspeichers besteht gegenuber den bisher 
verwendeten Materialien in einer hoheren Speicherdichte (DNA Molekule haben eine GroBe 
d.e bei 1 0 1 m liegt), und einem sehr viel geringeren Energieverbrauch (zur Berechnung der in 
enzymatischen Reaktionen benotigten Energie siehe t L. M. Adleman, Molecular Computation 
of So.ut,ons to Combinatorial Problems, Science, 266, 1021-1024, (1994)]). AuBerdem ergibt 
sich eine erheblrch verbesserte Umweltvertraglichkeit, weil die hier beschriebenen Polymere 
Biomolekute ohne jegliche Toxizitat sind. 

Der hier beschriebene Ansatz hat gegenuber den bisher fur das DNA Computing verwendeten 
wassngen Losungen den Vorzug hoherer Speicherdichte und der Adressierbarkeit einzelner 

Polymere. 



WO 00/59917 - PCT/EP00/02893 



Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein polymerer Datenspeicher, 
umfassend erfindungsgemaBe informationstragende Polymere, erfindungsgemaBe Verfahren 
zur Verknupfung von MolekGlen, erfindungsgemaBe Ausleseverfahren oder 
5 erfindungsgemaBe Isolierungs- und Vervielfaltigungsverfahren. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung eines 
DNA Computers 



10 



Mithilfe der bereits beschriebenen Informationsdarstellung durch Algomere und Logomere 
kann ein DNA Computer konstruiert werden. Der DNA Computer umfaBt (s. Abbildung 10): 

a) Oligonukleotidsynthesizer 

b) Thermozykler 

15 c) Pipettiervorrichtung 

d) Vorrichtung zur Isolation von Polymeren 

e) Vorrichtung zur Auftrennung von Nukleinsauren, z.B. Elektrophoresesystem 

f) Scanner 

g) Steuerungsrechner (Workstation, z.B. PC) 

20 Der DNA Computer ist konstruiert als ein Hybridsystem, bei dem einfache, rechenintensive 
Algorithmen oder die Speicherung von Daten mithilfe von DNA und den dazu benotigten 
Geraten (Gerate a) bis e)) vorgenommen werden und ein herkommlicher Computer 
(vorzugsweise Workstation, z.B. PC) als Host und Steuerungsrechner dient. 
Der DNA Computers beinhaltet mindestens einen Thermozykler, der als informations reaktor" 

25 dient und uber den Steuerungsrechner gesteuert werden kann (z.B. MJ Research PTC-100, 
Eppendorf Mastercycler). In den Tubes oder Mikrotiterplatten des Thermozyklers befinden 
sich Molekulgemische aus Nukleinsauren, Enzymen und weiteren chemischen Substanzen 
(z.B. Puffer, Nukleotide), die fur die Algomer-Assemblierung (Schritt IV des 
erfindungsgemaBen Verfahrens) und die Symbolpolymerisation (Schritt V des 
30 erfindungsgemaBen Verfahrens) benotigt werden. Programmiert wird der DNA Computer 
durch die Implementierung von Algorithmen als Grammatiken (Schritt I des 
erfindungsgemaBen Verfahrens). Die fiir die Grammatiken jeweils benotigten 
Monomersequenzen werden durch das NFR-Verfahren und die Benutzung eines 
Oligonukleotidsynthesizers (z.B. ABI 392, ABI 398, ABI 3948 von Perkin-Elmer Applied 
35 Biosystems) hergestellt (Schritte II und III des erfindungsgemaBen Verfahrens). Diese 
Monomersequenzen gehen als Input in den Thermozykler ein, in dem die Algomer- 
Assemblierung (Schritt IV des erfindungsgemaBen Verfahrens) stattfindet. 
Die so gewonnenen Algomere werden in eine oder mehrere Reaktionskammern des 
Thermozyklers uberfuhrt, wo sie zu Logomeren verkniipft werden (Symbolpolymerisation, 
40 Schritt V des erfindungsgemaBen Verfahrens). Die so gewonnen Logomere werden in einer 
eigenen Vorrichtung isoliert und vervielfaltigt. Diese Vorrichtung kann nach den Prinzipien 
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arberten, die in dem erfindungsgemaBen Verfahren beschrieben worden sind. Nach Isoiierung 
und Vervielfaltigung konnen die Logomere gelesen werden. Dazu werden sie wiederum in 
e.nem Thermozykler erfindungsgemaB ausgelesen. Die aus dem Ausleseverfahren 
result.erenden Nukleinsaurefragmente konnen, wie bereits beschrieben, durch 
Gelelektrophorese gelesen werden. Hier dient das Gelelektrophoresegerat als Ausgabegerat 
des DNA Computers, die solcherart erhaltenen Bandenmuster werden von einem Scanner in 
den Steuerungsrechner eingelesen. 

Der Steuerungsrechner nimmt jetzt seinerseits aufgrund der solcherart erhaltenen Ergebnisse 
we,tere Berechnungen und Steuerungen vor und setzt ggfs. weitere molekulare Reaktionen in 
Gang. 2.B. kann der Steuerungscomputer aufgrund erhaltener Ergebnisse die 
Neuimplementierung von Grammatiken (Herstellung von Oligomeren mit dem NFR- 
Verfahren) veranlassen. Auf diese Weise konnen die durch molekulare Verfahren als 
Logomere erhaltenen Informationen nicht nur als passive Daten sondem auch als 
Instruktionen (und Adressen) dienen. Dadurch ist ein sich selbst steuernder ProzeB 
verschiedener Algorithmen moglich, der fur eine universale Datenverarbeitung notig ist. 
Der DNA Computer verarbeitet dabei Informationen als Oligo- und Polymere Als 
Speicherzellen der Daten dienen Klonierungsvektoren (Plasmide), die sich in flussiger Losung 
oder auf einem festen, adressierbaren Trager befinden. 

Der DNA Computer ist wie oben beschrieben mittels Grammatiken programmierbar und kann 
von e.nem herkommlichen Computer, der als Steuerungsrechner und Host-System fungiert, 

gesteuert werden. 

Da der DNA Computer bestimmte Operationen in molaren GroBenordnungen (z B die 
Symbolpolymerisation, wie in Schritt V des erfindungsgemaBen Verfahrens beschrieben, in 
10 - 10 Elementaroperationen pro Sekunde) vornehmen kann, ist eine mogliche 
Anwendung die Berechnung einfacher, rechenintensiver Algorithmen. Jedoch kann der DNA 
Computer auch fur andere Anwendungen, z.B. die Erzeugung bestimmter, regelmaBiger DNA 
Strukturen, die z.B. innerhalb der Nanotechnologie interessant sind, ven*endet werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein DNA-Computer, umfassend 
erfmdungsgemaBe informationstragende Polymere. Ein weiterer Gegenstand der 
vorhegenden Erfindung ist ein DNA-Computer, in dem ein erfindungsgemaBes 
Austeseverfahren und/oder erfindungsgemaBe Isolierungs- und Vervielfa.tigungsverfahren 
eingesetzt werden. 
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Die oben beschriebenen Verfahren ermogiichen beispielsweise die Herstellung 
kleinster molekularer Strukturen mit Logomeren 

Mit den hier beschriebenen Logomeren lassen sich kleinste molekulare Strukturen 
5 (Nanostrukturen) herstellen. Bausteine solcher Strukturen sind Algomere, die zu 

regelmaBigen Mustern von Logomeren zusammengefugt werden konnen. Z.B. konnen 

verschiedene Algomere mit unterschiedlichen Fremdmolekulen (Liganden) dotiert werden, urn 

regelmaBige, hohermolekulare Muster der jeweiligen Liganden zu erhalten. Die Logomere 

fungieren dabei als "Skelett" molekularer Baugruppen von Liganden. 
10 Z.B. konnte ein binares Logomer alternierende Muster leitfahiger und nicht-leitfahiger 

Liganden enthalten. Durch die Anordnung vieler Logomere auf einem festen Trager konnen 

so Leiterbahnen im Nanometerbereich entstehen. 

Als Liganden konnen aber auch Biomolekule, Antikorper, optisch aktive Molekiile o.a. 
verwendet werden. 

15 

Logomere konnen als "intelligenter" Klebstoff eingesetzt werden (siehe Abbildung 18). Dabei 
macht man sich die Hybridisierung komplementarer Nukleotide zunutze. Bringt man auf die zu 
verklebenden Flachen Logomere auf, die etwa kovalent an die zu verklebenden Flachen 
gebunden werden, so konnen ansonsten vollig identische Flachen nur dann verkleben, wenn 
20 sie komplementare Sequenzen aufweisen, da nur jeweils Flachen komplementarer 
Nukleinsauren Wasserstoffbruckenbindungen ausbilden. Die "Intelligenz" des Kiebstoffes 
besteht also in einer durch die jeweils verwendeten Sequenzen hochselektiven 
Adhasionswirkung. Dabei kann auch die Adhasionsstarke fur zu verklebende Flachen genau 
eingestellt werden: Zum einen kann uber die Dichte der Logomere auf den jeweiligen Flachen 
25 deren Adhasionsstarke eingestellt werden, zum anderen kann liber das AT/GC Verhaltnis der 
Logomere deren Schmelzpunkt variiert werden, so daB verklebte Flachen bei 
unterschiedlichen Temperaturen ihre Adhasion verlieren. Aufgrund der Tatsache, daB hier 
unschadliche, leicht abbaubare Biomolekule als Klebstoff verwendet werden, konnen derartige 
Klebstoffe auch zur medizinische Verwendung (z.B. Chirurgie, Mikrochirugie) eingesetzt 
30 werden. Eine andere Verwendung ist die Nutzung des beschriebenen Verfahrens in 
Hochprazisions- und Authentifizierungsanwendungen. 

Versetzt man die zur Herstellung von Logomeren verwendeten Algomeren mit Sequenzen zur 
Bindung von Liganden, so konnen starkere Adhasionswirkungen erreicht werden. Solche 
Liganden konnen im Falle von DNA DNA-bindenden Proteinen, z.B. spezifische, gegen DNA- 

35 Sequenzen gerichtete Antikorper sein. Diese konnen z.B. jeweils uber einen weiteren 
Liganden untereinander verbunden werden (siehe Abbildung 19). Eine einfache, nicht- 
programmierbare Adhasionswirkung kann auch ohne Logomere erreicht werden, wenn die 
verwendeten Proteine (z.B. Antikorper) ihrerseits an die zu verklebenden Flachen binden 
konnen (wie z.B. Antikorper, wenn die zu verklebende Flache ihr Antigen ist). Siehe dazu auch 

40 Abbildung 20. Einfachere Klebstoffe sind moglich, wenn, an bestimmte Flachen spezifisch 
bindende, Proteine gentechnisch hergestellt werden. 
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E.ne alternative Methode besteht darin, die zu verklebenden Flachen nicht iiber schwache 
Wechselwirkung, sondern uber kovalente Bindung miteinander zu verbinden. Abweichend 
vom oben vorgestellten Verfahren wird die Adhasionskraft uber die Dichte von Algomeren 
eingestellt. Dabei werden die zu verklebenden Flachen mit Algomeren, die zueinander jeweils 
komplementare sticky ends tragen versehen. Diese konnen dann hybridisieren und durch 
Ligation miteinander kovalent verbunden werden. 

Mit Logomeren konnen Oberflachen unterschiedlichster Struktur und unterschiedlichster 
physikalischer Eigenschaften hergestellt werden. Den Anwendungen ist gemein, daB sich mit 
den Logomeren nahezu beliebige Muster im Nanometerbereich bilden lassen, die das Skelett 
kleinster molekularer Bauelemente sein konnen. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
-nformationstragender Polymere, insbesondere der erfindungsgemaG erhaltlichen 
.nformationstragenden Polymere, zur Herstellung oder Bearbeitung kleinster molekularer 
Strukturen oder als molekularer Kleber. 

Die oben beschriebenen Verfahren ermdglichen beispielsweise die Herstellung 
nanotechnologischer Baukastensysteme. 

Mit dem oben beschriebenen NFR-Verfahren und dem "Parallel Extension" Verfahren konnen 
erstmals groBere Grammatiken direkt in Molekiile ubersetzt werden. Dabei sind diese 
Grammatiken nicht auf regulare Grammatiken beschrankt. U. a. aufgrund der 
Wiederverwendbarkeit von Sequenzen lassen sich damit z.B. auch y-MolekQle [Matthias 
Scheffler, Axel Dorenbeck, Stefan Jordan, Michael Wustefeld, Giinter von Kiedrowski Self- 
Assembly of Trisoligonucleotidyls: The Case for Nano-Acetylene and Nano-Cyclobutadiene 
Angewandte Chemie Int. Ed., 38(22), 3312-3315, (1999)] und DX-Molekule [Erik Winfree 
Furong Liu, Lisa A. Wenzler & Nadrian C. Seeman, Design and self-assembly of two- 
d.mensional DNA crystals, Nature, 394, 539-544, (1998)] programmieren. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung des NFR- 
Verfahrens, des "Parallel-Extension" Verfahrens und der Ubersetzung von Grammatiken in 
Molekule zur Herstellung von Komponenten nanotechnologischer Baukastensysteme 



Die oben beschriebenen Verfahren ermdglichen beispielsweise die kontrollierte, 
programmierbare Herstellung von biologisch aktiven Nukleinsauren. 

Dazu setzt man z.B. als Terminale anstelle kunstlicher Sequenzen zur Darstellung von 
Symbolen biologisch aktive Sequenzen wie Restriktionssites, Rekombinationssites 
Centromere, Promotoren, Exons, Gene o.a. ein. Diese konnen dann auf kontrollierte 
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programmierbare Weise zu biologisch aktiven Konstrukten, z.B. zu Genen oder kunstlichen 
Chromosomen zusammengesetzt werden. 

Ein weiterer Gegenstand der vorliegenden Ertindung ist daher die Verwendung 
5 informationstragender Polymere, insbesondere der erfindungsgemaG erhaltlichen 
intormationstragenden Polymere, zur kontrollierten Herstellung biologisch aktiver 
Nukleinsauren. 
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1 . Verfahren zur Herstellung von informationstragenden Polymeren, das umfaBt, 

I. eine regulare Grammatik G = (2, V, R, S) mit einem endiichen Terminalalphabet 2, 
einer endlichen Variablenmenge V, einer endiichen Regelmenge R und einem 
Startsymbol S zu definieren; 

II. das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von 
Monomersequenzen; 

III. mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, 
indem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer 
Grammatik G eindeutig darstellen; 

IV. aus den in Schritt III hergestellten Monomersequenzen fur jede Regel der 
Regelmenge R von G ein die Regel reprasentierendes Oligomer zusammenzusetzen; 

V. die in Schritt IV zusammengesetzten Oligomere zu informationstragenden Polymeren 
zu verkniipfen. 



2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB das Terminalalphabet 2 einer 

Grammatik G die Terminate 0, 1, n Startterminale s (s 0 , s, s n ) und m Endterminale e (e 0( 

e1 em >' enthalt, wobei n und m jeweils groBer oder gleich 0 sind und eine naturliche Zahl 

darstellen. 



3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB die in Schritt III 
konstruierte Monomersequenz Nukleotide, insbesondere Ribonukleotide, besonders 
bevorzugt Desoxyribonukleotide umfaBt. 



4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daB die in Schritt III konstruierte 
Monomersequenz Proteinerkennungssequenzen (z.B. Restriktionsschnittstellen, 
Proteinbindungsstellen, Stopcodons) umfaBt. 



5. Verfahren nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, daB man 
die Synthese der Monomersequenzen in Schritt II und III in vitro, vorzugsweise mittels eines 
Oligonukleotid-Synthezisers vornimmt. 
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6. Verfahren zur Isolierung und Vervielfaltigung von informationstragenden Polymeren, die 
nach einem der vorhergehenden Anspruche erhalten wurden, dadurch gekennzeichnet, daft 
man in Schritt V erhaltene informationstragende Polymere in Klonierungsvektoren ligiert, 
kompetente Zellen mit diesen Vektoren transformiert und die erfolgreich transformierten 

5 Bakterien anhand von Selektionsmarkern selektioniert. 

7. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, die nach 
einem der vorhergehenden Anspruche erhalten Oder isoliert und vervielfaltigt wurden, 
dadurch gekennzeichnet, da3 man 

a) mindestens n-1 das informationstragende Polymer enthaltende Losungen mit jeweils 
10 einem Paar gegenlaufiger Primer versetzt, wobei n fur die Zahl der als Elongatoren in 

dem Polymer enthaltenen Oligomere steht; 

b) mindestens n-1 PCR-Ansatze durchfuhrt, wobei n fur die Zahl der als Elongatoren in 
dem Polymer enthaltenen Oligomere steht und jeweils ein Primer eines jeden Paares 
in dem dem Elongator gegenuberliegenden Terminator primt und der andere Primer 

15 in dem Elongator selbst primt; 

c) die aus der PGR erhaltenen Polymer-Fragmente nach ihrer Lange durch 
Elektrophorese auftrennt und 

d) das aus der Elektrophorese erhaltene Muster optisch ausiiest. 

20 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daB das Auslesen in Schritt d) 
automatisiert durch einen Scanner oder eine Sequenziermaschine erfolgt. 

9. Informationstragendes Polymer, erhalten nach einem der Anspruche 1 bis 6. 

25 10. Zufallszahiengenerator, umfassend informationstragende Polymere, insbesondere 
Polymere nach Anspruch 9. 

1 1 . Polymerer Datenspeicher, umfassend informationstragende Polymere nach Anspruch 9. 
30 12. DNA-Computer, umfassend informationstragende Polymere nach Anspruch 9. 
13. Biochip, umfassend informationstragende Polymere nach Anspruch 9. 
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14. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von 
Moiekulargewichtsstandards. 



15. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Darstellung von 
Datenstrukturen. 



16. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 als Marker oder Signaturen. 



17. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Qualitatssicherung. 



18. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Falschungssicherung. 

19. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung gentechnischer Erzeugnisse. 

20. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Lebensmitteln. 



21. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Organismen. 

22. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung chemischer Erzeugnisse. 

23. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung medizinischer und pharmazeutischer 
Erzeugnisse. 
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24. Verwendung von informationstragencien Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Dokumenten. 

25. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
5 Anspruch 9 zum Zwecke der Kennzeichnung von Geld. 

26. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Gegenstanden und Maschinen. 

10 27. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Flussigkeiten, Losungen, Suspensionen 
oder Emulsionen. 

28. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
15 Anspruch 9 zur Verschliisselung von Information. 

29. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Authentisierung von Personen und Gegenstanden. 

20 30. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 als molekulare Kleber. 

31. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung 
Oder Bearbeitung kleinster molekularer Strukturen. 

25 

32. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur 
Qualitatskontrolle synthetisch hergestellter Oligonukleotide. 



33. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von 
30 Biochips. 
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34. 1 bis n-bytige Nukleinsauren, insbesondere 1 bis n-bytige Nukleinsauren erhalten nach 
einem der Anspruche 1 bis 6. 



35. 1 bis n-bytige Biochips, insbesondere 1 bis n-bytige Biochips erhalten nach einem der 
Anspruche 1 bis 6. 



36. Verwendung von Biochips, insbesondere von Biochips nach einem der Anspruche 13, 33 
und 35 als Datenspeicher. 



37. Verwendung von Biochips, insbesondere von Biochips nach einem der Anspruche 13, 33 
und 35 zur Herstellung von optischen Anzeigegeraten oder Bildschirmen. 

38. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zur Kennzeichnung einzelner Molekule, insbesondere von Nukleinsauren, 
besonders bevorzugt von Genen. 

39. Verwendung von Nukleinsauren zur Verschlusselung von Information. 

40. Verwendung von Nukleinsauren zur Verschlusselung von Information, dadurch 
gekennzeichnet, daB zur Entschlusselung kurze Nukleinsauresequenzen (Primer) als 
Schlussel benutzt werden. 



41. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zur Verschlusselung von Information, dadurch gekennzeichnet, daf3 das 
informationstragende Polymer in einer Vielzahl anderer Polymere verborgen ist. 

42. Verwendung von Polymeren zum Zwecke der Kennzeichnung, dadurch gekennzeichnet, 
da3 die Polymere verschlusselt sind. 



43. Herstellung biologisch aktiver Molekule mit kontrolliertem, programmierbaren Verknupfen 
von Sequenzen. 
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44. Herstellung bioiogisch aktiver Molekule unter Verwendung von Algomeren. 

45. Verfahren zum Auslesen von information aus informationstragenden Polymeren die aus 
den Anspruchen 1 bis 6 erhalten Oder isoliert und vervielfaltigt wurden, dadurch 

5 gekennzeichnet, da3 man zum Auslesen Biochips benutzt. 

46. Verwendung des NFR-Verfahrens zur Herstellung von Biochips. 

47. Verwendung des NFR-Verfahrens zur Herstellung nanotechnologischer Komponenten 
10 Oder von Komponenten nanotechnologischer Baukastensysteme. 
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Name Sequenz 

00 OOU tcgaggatatccgggcttcgggtgaccgggatcttaaga 
O0L agcttcttaagatcccggtcacccgaagcccggatatcc 

01 010 tcgaggatatcccttggcggtgaggcggcgatcttaaga 
OIL agcttcttaagatcgccgcctcaccgccaagggatatcc 

02 02U tcgaggatatctgtgggctacggggccgcgatcttaaga 
02L agcttcttaagatcgcggccccgtagcccacagatatcc 

03 03U tcgaggatatctaggtggctgcgcggggcgatcttaaga 
03L agcttcttaagatcgccccgcgcagccacctagatatcc 

50 SOU ttaagcgaagtggcctggcgggcgctagcg 
SOL aattcgctagcgcccgccaggccacttcgc 

51 S1U ttaagaacccgagccccggacgggctagcg 
S1L aattcgctagcccgtccggggctcgggttc 

52 S2U ttaagcgcaccaggcagagcgcggctagcg 
S2L aattcgctagccgcgctctgcctggtgcgc 

53 S3U ttaagtcctcgtggtcgggcggcgctagcg 
S3L aattcgctagcgccgcccgaccacgaggac 

EO EOU gatccccatggaatcccttggcggtgaggcggcgatatct 

EOL ctagagatatcgccgcctcaccgccaagggattccatggg 

El E1U gatccccatggaatctgtgggctacggggccgcgatatct 

E1L ctagagatatcgcggccccgtagcccacagattccatggg 

E2 E2U gatccccatggaatctaggtggctgcgcggggcgatatct 

E2L ctagagatatcgccccgcgcagccacctagattccatggg 

E3 E3U gatccccatggaatccgcaagccccaaggccccgatatct 

E3L ctagagatatcggggccttggggcttgcggattccatggg 

XO XOU ctagcgtatgccctgtagtttggagc 

XOL catggctccaaactacagggcatacg 

XI X1U ctagcgtaaagccaactgtaccctgc 

X1L catggcagggtacagttggctttacg 

X2 X2U ctagcgagactaaggttgttggtcgc 

X2L catggcgaccaacaaccttagtctcg 

X3 X3U ctagcgttccttcaagtcactcgtcc 

X3L catgggacgagtgacttgaaggaacg 

X4 X4U ctagccctgcccacagtagaataagc 

X4L catggcttattctactgtgggcaggg 

X5 X5U ctagcgaatcaagactcgtgctaccc 

X5L catggggtagcacgagtcttgattcg 

X6 X6U ctagcgatgacagttagacgcttccc 

X6L catggggaagcgtctaactgtcatcg 

X7 X7U ctagcctcctgaacctaagtcatcgc 

X7L catggcgatgacttaggttcaggagg 

X8 X8U ctagcccaaagttacagacctcagcc 

X8L catgggctgaggtctgtaactttggg 
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X9 X9U ctagcgacctatgcaatctactcgcc 
X9L catgggcgagtagattgcataggtcg 
X10 X10U ctagccagtagtaatcttccgcaggc 
XI OL catggcctgcggaagattactactgg 
XI 1 XI 1U ctagcctgttggtgggtactcctaac 
XI 1L catggttaggagtacccaccaacagg 
X12 X12U ctagcaacgaggtggtacgacatagc 
X12L catggctatgtcgtaccacctcgttg 
XI 3 X13U ctagccgcagtcattatagagagccc 
X13L catggggctctctataatgactgcgg 
XI 4 XI 4 U ctagcgtacttgtccctccagcatac 
XI 4L catggtatgctggagggacaagtacg 
X15 X15U ctagcatcctgtgtgcctaagtacgc 
XI 5L catggcgtacttaggcacacaggatg 
XI 6 XI 6U ctagcgaggcacttgacgtatgactc 
XI 6L catggagtcatacgtcaagtgcctcg 
X17 X17U ctagcgggatacctttctaagcgacc 
X17L catgggtcgcttagaaaggtatcccg 
XI 8 X18U ctagcggataggtcgcagtcttgtac 
XI 8L catggtacaagactgcgacctatccg 
XI 9 X19U ctagcgtacagtgcgaagagggtaac 
X19L catggttaccctcttcgcactgtacg 
X20 X20U ctagcgcctccgacacagttactaac 
X20L catggttagtaactgtgtcggaggcg 
X21 X21U ctagcgtgggtctggaacactattgc 
X2 1L cat ggcaatagtgt t ccagacccacg 
X22 X22U ctagcaactcctcactgttcactgcc 
X22L catgggcagtgaacagtgaggagttg 
X23 X23U ctagccgtatggtatatcgtcagccc 
X23L catggggctgacgatataccatacgg 
X24 X24U ctagcgcacagaccaaggacattacc 
X24L catgggtaatgtccttggtctgtgcg 
X25 X25U ctagcctcccactaaacggtcctatc 
X25L catggataggaccgtttagtgggagg 
X2 6 X2 60 ct agccacggaccgagt at ctattgc 
X26L catggcaatagatactcggtccgtgg 
X27 X27U ctagcgtctgatgagcgcagttagtc 
X27L catggactaactgcgctcatcagacg 
X28 X28U ctagcgagaatgcggtgatagtgacc 
X28L catgggtcactatcaccgcattctcg 
X29 X2 9U ctagcctacactaaccgacggaatgc 
X2 9L catggcattccgtcggttagtgtagg 
X30 X30U ctagcaagtccttgttacgagtcccc 
X30L catgggggactcgtaacaaggacttg 
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X31 X31U ctagcacctgaagttacgggaagtcc 
X31L catgggacttcccgtaacttcaggtg 
X32 X32U ctagcaacaggttccttacagagggc 
X32L catggccctctgtaaggaacctgttg 
X33 X33U ctagcacgtagccaagacttatcccc 
X33L catgggggataagtcttggctacgtg 
X34 X34U ctagccagtcaggtctattgttgccc 
X34L catggggcaacaatagacctgactgg 
X35 X35U ctagcgagaaccatattgcccctacc 
X35L catgggtaggggcaatatggttctcg 
X36 X3 6U ctagccataaagaggagactgggctc 
X36L catggagcccagtctcctctttatgg 
X37 X37U ctagccatagtctgcgaatactgccc 
X37L catggggcagtattcgcagactatgg 
X38 X38U ctagcgttagggcagccttaggtaac 
X38L catggttacctaaggctgccctaacg 
X39 X39U ctagcatagatgtgacagtgggacgc 
X39L catggcgtcccactgtcacatctatg 
X4 0 X4 0U ctagcgattagagttgtagggcgctc 
X40L catggagcgccctacaactctaatcg 
X4 1 X4 1U ct agctggaagt acgt gt gggatagc 
X4 1L catggctatcccacacgtactt ccag 
X4 2 X4 2U ct agctgagatagt cgtggat ggt cc 
X42L catgggaccatccacgactatctcag 
X4 3 X4 3U ctagcacgacctgttaccgttacctc 
X4 3L catggaggtaacggtaacaggtcgtg 
X4 4 X4 4U ctagccattgctggaactgctactcc 
X4 4L catgggagtagcagttccagcaatgg 
X4 5 X4 5U ctagcgtaccccacccacataaagtc 
X4 5L catggactttatgtgggtggggtacg 
X4 6 X4 6U ct agcagtgtaggaatacccgtgct c 
X4 6L catggagcacgggtattcctacactg 
X47 X47U ctagccgttcgctatgttctacagcc 
X47L catgggctgtagaacatagcgaacgg 
X4 8 X48U ctagcccctgtccccatacattactc 
X4 8L catggagtaatgtatggggacagggg 
X4 9 X4 9U ctagcatgtaggcaactgtcgtcacc 
X4 9L cat gggtgacgacagtt gcct acatg 
X50 X50U ctagcgtatgttcccagcgagtacac 
X50L catggtgtactcgctgggaacatacg 
X51 X51U ctagcgtgtaataccacgggtgttgc 
X51L catggcaacacccgtggtattacacg 
X52 X52U ctagctgtagtggtctttacgtggcc 



X52L 



catgggccacgtaaagaccactacag 
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X53 X53U ctagcgtcaggtgctcatccagttac 





X53L 


catggtaactggatgagcacctgacg 


X54 


X54U 


ctagcctccacaaacatacccacacc 




X54L 


catgggtgtgggtatgtttgtggagg 


X55 


X55U 


ctagctgaggtgtcaatgagagaggc 




X55L 


catggcctctctcattgacacctcag 


X56 


X56U 


ctagctcactcctctacgatgaacgc 




X56L 


catggcgttcatcgtagaggagtgag 


X57 


X57U 


ctagctcgtactgagatgttcctgcc 




X57L 


catgggcaggaacatctcagtacgag 


X58 


X58U 


ctagctgactctggacttatgacgcc 




X58L 


catgggcgtcataagtccagagtcag 


X59 


X59U 


ctagcagattacggagtgtgttcccc 




X59L 


catgggggaacacactccgtaatctg 


X60 


X60U 


ctagccttaccactgttgcagaggac 




X60L 


catggtcctctgcaacagtggtaagg 


X61 


X61U 


ctagcccgttatccgtactggaagtc 




X61L 


catggacttccagtacggataacggg 


X62 


X62U 


ctagcgtttgggtatcggctgtactc 




X62L 


catggagtacagccgatacccaaacg 


X63 


X63U 


ctagcgaggatgaacacaaggaggtc 




X63L 


catggacctccttgtgttcatcctcg 


X64 


X64U 


ctagccatagcggatagggttacgtc 




X64L 


catggacgtaaccctatccgctatgg 


X65 


X65U 


ctagctctcatatccctaacctggcc 




X65L 


catgggccaggttagggatatgagag 


X66 


X66U 


ctagcggtattgtctcgtcatgcacc 




X66L 


catgggtgcatgacgagacaataccg 


X67 


X67U 


ctagcatcacctacctgagattgccc 




X67L 


catggggcaatctcaggtaggtgatg 


X68 


X68U 


ctagcgactggggtctgttgtttctc 




X68L 


catggagaaacaacagaccccagtcg 


X69 


X69U 


ctagcaggggtcggagttagagaatc 




X69L 


catggattctctaactccgacccctg 


X70 


X70U 


ctagcaccgaaggatgttgagtctcc 



X70L catgggagactcaacatccttcggtg 

X71 X71U ctagcggtgatgactcggaacttctc 

X71L catggagaagttccgagtcatcaccg 

X72 X7 2U ctagcgggtacacaaatggaaggtcc 

X72L catgggaccttccatttgtgtacccg 

X73 X73U ctagcatcatctcgggtctacttcgc 

X73L catggcgaagtagacccgagatgatg 

X7 4 X7 4U ctagcaatcagtagacatcgccctcc 

X7 4L catgggagggcgatgtctactgattg 
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X7 5 X75U ctagccacggaagtctattcacacgc 
X7 5L catggcgtgtgaatagacttccgtgg 
X7 6 X7 6U ctagcaggggctgttacatgaagagc 
X7 6L catggctcttcatgtaacagcccctg 
X77 X77U ctagccgtgacctgctgtgatttacc 
X77L catgggtaaatcacagcaggtcacgg 
X7 8 X78U ctagcatagtcttagtccggcatcgc 
X7 8L catggcgatgccggactaagactatg 
X7 9 X7 9U ctagcatcactacctgcctattcgcc 
X79L catgggcgaataggcaggtagtgatg 
X80 X80U ctagcttaccttgtctaaccctcgcc 
X80L catgggcgagggttagacaaggtaag 
X81 X81U ctagctcttaatccctctggctgacc 
X81L catgggtcagccagagggattaagag 
X82 X82U ctagcagacccatccgagtaccatac 
X82L catggtatggtactcggatgggtctg 
X83 X83U ctagcagactgaaccctcaagatgcc 
X8 3L catgggcatcttgagggttcagtctg 
X8 4 X84U ctagcaggcattctgatactcctcgc 
X8 4L catggcgaggagtatcagaatgcctg 
X8 5 X85U ctagcctgcaagagtcatatcacggc 
X85L catggccgtgatatgactcttgcagg 
X8 6 X8 6U ctagcgtgggatttcgtctataccgc 
X8 6L catggcggtatagacgaaatcccacg 
X87 X87U ctagccagaccgcctcctaatcttac 
X87L catggtaagattaggaggcggtctgg 
X88 X88U ctagcatctccttgcttgtacctcgc 
X88L catggcgaggtacaagcaaggagatg 
X8 9 X8 9U ctagctgtgcggctatgtagtcctac 
X8 9L catggtaggactacatagccgcacag 
X90 X90U ctagcagtgtcctaagcaaagacggc 
X90L catggccgtctttgcttaggacactg 
X91 X91U ctagcttcccttctaccctgtaccac 
X91L catggtggtacagggtagaagggaag 
X92 X92U ctagcaaggtgtccagtggtcagatc 
X92L catggatctgaccactggacaccttg 
X93 X93U ctagcatcagcatagggaccacactc 
X93L catggagtgtggtccctatgctgatg 
X94 X94U ctagcggacggccaactatcataagc 
X94L catggcttatgatagttggccgtccg 
X95 X95U ctagctgaacctctgtgctgtaggac 
X95L catggtcctacagcacagaggttcag 
X96 X96U ctagctgacttcacctggctgtctac 
X96L catggtagacagccaggtgaagtcag 
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X97 X97U ctagctcctaactctattgccgagcc 
X97L catgggctcggcaatagagttaggag 
X98 X98U ctagccttatcctacgcgagcagatc 
X98L catggatctgctcgcgtaggataagg 
X99 X99U ctagccgcataagcacatctgtagcc 
X99L catgggctacagatgtgcttatgcgg 
XI 00 X100U ctagcaacgtagagaacgaagccagc 
X100L catggctggcttcgttctctacgttg 
X101 X101U ctagctcacggagtcctgatgtatgc 
X101L catggcatacatcaggactccgtgag 
X102 X102U ctagcatgtatcccgttggtgtaggc 
X102L catggcctacaccaacgggatacatg 
X103 X103U ctagcgcctgactattttgacggtcc 
X103L catgggaccgtcaaaatagtcaggcg 
X104 X104U ctagcgatagcacttcaaacgtcccc 
X104L catgggggacgtttgaagtgctatcg 
XI 05 X105U ctagcgaagtgcattcttaccgtccc 
X105L catggggacggtaagaatgcacttcg 
X10 6 X106U ctagcccttgtcgttctaaactgggc 
X106L catggcccagtttagaacgacaaggg 
X107 X107U ctagcgtttaaggagtgttcgtccgc 
X107L catggcggacgaacactccttaaacg 
X108 X108U ctagccagagttaaagttgccccacc 
X108L catgggtggggcaactttaactctgg 
XI 09 X109U ctagcgtcagaatcaatctcctggcc 
X109L catgggccaggagattgattctgacg 
XI 10 X110U ctagcgtgcttgacctgaatccttcc 
X110L catgggaaggattcaggtcaagcacg 
XI 11 X111U ctagcaccacccttcttcaccctatc 
X111L catggatagggtgaagaagggtggtg 
XI 12 X112U ctagccagaaagggcagtcctaatgc 
X112L catggcattaggactgccctttctgg 
XI 13 X113U ctagcaacccactatcgtacatccgc 
X113L catggcggatgtacgatagtgggttg 
X114 X114U ctagcgaatacttgggagttgcgagc 
X114L catggctcgcaactcccaagtattcg 
X115 X115U ctagcggcaataagttcaggctgtcc 
X115L catgggacagcctgaacttattgccg 
XI 16 X116U ctagcaagggagcagacagtcatgtc 
X116L catggacatgactgtctgctcccttg 
XI 17 X117U ctagccataacacacgggacaacacc 
X117L catgggtgttgtcccgtgtgttatgg 
X118 X118U ctagccagaaacgaaggtcctaacgc 



X118L catggcgttaggaccttcgtttctgg 
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X119 X119U ctagcgtgccaagccttaatagtgcc 
X119L catgggcactattaaggcttggcacg 
X120 X120U ctagccggatgaggatgtatcaggtc 
X120L catggacctgatacatcctcatccgg 
X121 X121U ctagccgtggcgttaaactcttaggc 
X121L catggcctaagagtttaacgccacgg 
X122 X122U ctagcctgctcttgatggataaggcc 
X122L catgggccttatccatcaagagcagg 
X123 X123U ctagcatcagagtggagagcacgatc 
X123L catggatcgtgctctccactctgatg 
X124 X124U ctagcgcacaggaaatagaagtcgcc 
X124L catgggcgacttctatttcctgtgcg 
X125 X125U ctagcccacccgactacagaacaatc 
X125L catggattgttctgtagtcgggtggg 
X12 6 X126U ctagccgagattacccagttgtggtc 
X126L catggaccacaactgggtaatctcgg 
X127 X127U ctagccgagttaatagacgcggaagc 
X127L catggcttccgcgtctattaactcgg 
X128 X128U ctagccgctgcggtttctctattacc 
X128L catgggtaatagagaaaccgcagcgg 
X129 X129U ctagctcagccgtaggtcttcaactc 
X12 9L catggagttgaagacctacggctgag 
X130 X130U ctagcttagtggagcctcttcacgtc 
X130L catggacgtgaagaggctccactaag 
X131 X131U ctagccagagtgtcggccttttaagc 
X131L catggcttaaaaggccgacactctgg 
X132 X132U ctagcctaaaacttgactcgcggacc 
X132L catgggtccgcgagtcaagttttagg 
X133 X133U ctagcccgtctggtcggataagatac 
X133L catggtatcttatccgaccagacggg 
X134 X134U ctagcagattggtcacaactccaggc 
X134L catggcctggagttgtgaccaatctg 
X135 X135U ctagcaccagaaggttggagaaggtc 
X135L catggaccttctccaaccttctggtg 
X136 X13 6U ctagccacatcttacaccgtcatcgc 
X136L catggcgatgacggtgtaagatgtgg 
X137 X137U ctagcgcgtcgggacttacaagatac 
X137L catggtatcttgtaagtcccgacgcg 
X138 X138U ctagcaggatggtgcaagcatact cc 
X138L catgggagtatgcttgcaccatcctg 
X139 X13 9U ctagcggacaaactgctggttcctac 
X13 9L catggtaggaaccagcagtttgtccg 
XI 4 0 X14 0U ctagcggttgcctcaaactggagtac 
X14 0L catggtactccagtttgaggcaaccg 
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X141 X141U ctagctttgtaagacaccccagagcc 
X141L catgggctctggggtgtcttacaaag 
XI 4 2 X14 2U ctagcccctttggtcgttagtgctac 
X142L catggtagcactaacgaccaaagggg 
XI 4 3 X14 3U ctagcagagggctgagggatagaaac 
X14 3L catggtttctatccctcagccctctg 
X144 X144U ctagcagttcgtacctttgacacgcc 
X14 4L catgggcgtgtcaaaggtacgaactg 
XI 4 5 X14 5U ctagcgatttgcagtgataccacccc 
X14 5L catgggggtggtatcactgcaaatcg 
X14 6 X14 6U ctagcgagtgtagaatccggctgaac 
X14 6L catggttcagccggattctacactcg 
XI 4 7 X14 7U ctagcgcaagtccgtgttcctcttac 
X14 7L catggtaagaggaacacggacttgcg 
XI 4 8 X14 8U ctagcctttgtacggtggtgaaaccc 
X14 8L catggggtttcaccaccgtacaaagg 
X14 9 X14 9U ctagcacttt catgtggagacgctcc 
X14 9L catgggagcgtctccacatgaaagtg 
XI 50 XI SOU ctagcaacactaagcggatgtcagcc 
X150L catgggctgacatccgcttagtgttg 
X151 X151U ctagcctaactcaactccgcaacgtc 
X151L catggacgttgcggagttgagttagg 
X152 X152U ctagcaagtagatggaaagggtgccc 
X152L catggggcaccctttccatctacttg 
X153 X153U ctagcgaaatacgaggaacgagggtc 
X153L catggaccctcgttcctcgtatttcg 
X154 X15 4U ctagcgaggctgctaagggaaaaagc 
X154L catggctttttcccttagcagcctcg 
XI 5 5 X155U ctagcggacgttatttcacacctcgc 
X155L catggcgaggtgtgaaataacgtccg 
X156 X156U ctagcgacacaagagcctaagccaac 
X156L catggttggcttaggctcttgtgtcg 
XI 57 X157U ctagcgtgtttgtttaccctgccagc 
X157L catggctggcagggtaaacaaacacg 
X158 X158U ctagcactgcgtcctcacaaagaagc 
X158L catggcttctttgtgaggacgcagtg 
X15 9 X159U ctagcagtccccgaagtcaaatagcc 
X159L catgggctatttgacttcggggactg 
XI 60 X160U ctagcgatacttcccaatgcagacgc 
XI 60L catggcgt ct gcatt gggaagtat eg 
XI 61 X161U ctagcggaactaatgtcatgctgccc 
X161L catggggcagcatgacattagttccg 
X162 X162U ctagcgcgatggtgataacgtaagcc 
X162L catgggcttacgttatcaccatcgcg 
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XI 63 X163U ctagcctcctgtacggcaaatgttcc 
X163L catgggaacatttgccgtacaggagg 
X164 X164U ctagcctatttggaccgcacaagacc 
X164L catgggtcttgtgcggtccaaatagg 
XI 65 X165U ctagcatccttgtagcggacacgtac 
X165L catggtacgtgtccgctacaaggatg 
XI 66 X166U ctagcaagtgggaatagggtccgtac 
X166L catggtacggaccctattcccacttg 
XI 67 X167U ctagcgatagaaccgactgcaatgcc 
X167L catgggcattgcagtcggttctatcg 
X168 X168U ctagcgcgaatgaagtggactatgcc 
X168L catgggcatagtccacttcattcgcg 
XI 69 X169U ctagccgaactttagcatccgtgacc 
X169L catgggtcacggatgctaaagttcgg 
X17 0 X170U ctagcgttagaaatgtctgcggtcgc 
X17 0L catggcgaccgcagacatttctaacg 
X171 X171U ctagcgcaccacacgaaagaatctcc 
X171L catgggagattctttcgtgtggtgcg 
X172 X172U ctagctcacactcttggtcggctatc 
X172L catggatagccgaccaagagtgtgag 
X17 3 X173U ctagctcactctggccgaactgtatc 
X17 3L catggatacagttcggccagagtgag 
X174 X17 4U ctagctggagaacggtcttgtctgtc 
X174L catggacagacaagaccgttctccag 
X17 5 X17 5U ctagcaggtatcgcgtccctaatgtc 
X175L catggacattagggacgcgatacctg 
X17 6 X17 6U ctagctggctcactacacgaacatgc 
X17 6L catggcatgttcgtgtagtgagccag 
X177 X177U ctagcgtaccagtgaaatcgggacac 
X177L catggtgtcccgatttcactggtacg 
X178 X17 8U ctagccgaagaacaacatcagagccc 
X17 8L catggggctctgatgttgttcttcgg 
X17 9 X17 9U ctagcgggtccaatcctaaagcaagc 
X17 9L catggcttgctttaggattggacccg 
X180 X180U ctagcttgagcagaagaactctcgcc 
X180L catgggcgagagttcttctgctcaag 
X181 X181U ctagcattgccgtggtgtaactacgc 
X18 1L catggcgtagttacaccacggcaatg 
X182 X182U ctagccgcatacgttctgtgcagtac 
X182L catggtactgcacagaacgtatgcgg 
X18 3 X183U ctagccagcgatatggtggtgctatc 
X183L catggatagcaccaccatatcgctgg 
XI 8 4 X184U ctagccgtaacacccagagattggac 



X184L catggtccaatctctgggtgttacgg 
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XI 85 X185U ctagctccacgataactcacaagggc 
X185L catggcccttgtgagttatcgtggag 
XI 8 6 X18 6U ctagctcacttccctggtcgtaatgc 
X18 6L catggcattacgaccagggaagtgag 
XI 8 7 X187U ctagcgcgttgtcacctaatacggac 
X187L catggtccgtattaggtgacaacgcg 
X188 X188U ctagcatgttacactcgcatccgacc 
X18 8L catgggtcggatgcgagtgtaacatg 
X18 9 X18 9U ctagcatgtagccagtgattgtgccc 
X18 9L catggggcacaatcactggctacatg 
X190 X190U ctagcaagatgcagagtctaccgcac 
X190L catggtgcggtagactctgcatcttg 
XI 91 X191U ctagcagaccgctctatcacaagcac 
X191L catggtgcttgtgatagagcggtctg 
X192 X192U ctagcagggaggtccagaatcttcac 
X192L catggtgaagattctggacctccctg 
XI 93 X193U ctagcttagaccagcactgcgaagtc 
X193L catggacttcgcagtgctggtctaag 
XI 94 X194U ctagcccgaggcgtgactatacaaac 
X194L catggtttgtatagtcacgcctcggg 
XI 95 X195U ctagcgacaacctacaaacgctccac 
X195L catggtggagcgtttgtaggttgtcg 
XI 96 X196U ctagccgtcattcgtcagaccagatc 
X196L catggatctggtctgacgaatgacgg 
XI 97 X197U ctagcagatgagtgacgatggttgcc 
X197L catgggcaaccatcgtcactcatctg 
XI 98 X198U ctagcacccacaaccaggaaaagtcc 
X198L catgggacttttcctggttgtgggtg 
X199 X199U ctagctgaggcatctttggagtacgc 
X199L catggcgtactccaaagatgcctcag 
X200 X200U ctagctgtaatcggtctcaggcaagc 
X200L catggcttgcctgagaccgattacag 
X201 X201U ctagcctacagtcggattggctcaac 
X201L catggttgagccaatccgactgtagg 
X202 X202U ctagccttcaaggacctcgtgcatac 
X202L catggtatgcacgaggtccttgaagg 
X203 X203U ctagcggcaggataaagtgctgacac 
X203L catggtgtcagcactttatcctgccg 
X204 X204U ctagcgcctggacggttaaaggttac 
X204L catggtaacctttaaccgtccaggcg 
X205 X205U ctagctgtccaagtaccaaagagcgc 
X205L catggcgctctttggtacttggacag 
X206 X206U ctagctgcacactgggtctaacacac 
X206L catggtgtgttagacccagtgtgcag 
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X207 X2 07U ctagcaatctgtcgcctgcatagtgc 
X207L catggcactatgcaggcgacagattg 
X208 X208U ctagccccttcgctcttctttcatcc 
X208L catgggatgaaagaagagcgaagggg 
X209 X209U ctagcaagatattctcccacgaccgc 
X209L catggcggtcgtgggagaatatcttg 
X210 X210U ctagcggtttctgcactacagccaac 
X210L catggttggctgtagtgcagaaaccg 
X211 X211U ctagcaaaggcatcggacatcctacc 
X211L catgggtaggatgtccgatgcctttg 
X212 X212U ctagcacgaagtatgcgttgtgagcc 
X212L catgggctcacaacgcatacttcgtg 
X213 X213U ctagcggacatcggatttggataccc 
X213L catggggtatccaaatccgatgtccg 
X214 X214U ctagccggtacttttgcgactctgac 
X214L catggtcagagtcgcaaaagtaccgg 
X215 X215U ctagcgttaccgctcaccgaaatctc 
X215L catggagatttcggtgagcggtaacg 
X216 X216U ctagcaagaagacgatgtgtgctcgc 
X216L catggcgagcacacatcgtcttcttg 
X217 X217U ctagcggctattcattctcgccctac 
X217L catggtagggcgagaatgaatagccg 
X218 X218U ctagcaagggaatgtcagttctgccc 
X218L catggggcagaactgacattcccttg 
X219 X219U ctagcggcttgttaggccgttaagac 
X219L catggtcttaacggcctaacaagccg 
X220 X220U ctagcaaggatagagatgccgttgcc 
X220L catgggcaacggcatctctatccttg 
X221 X221U ctagcagcccgacatgacagatacac 
X221L catggtgtatctgtcatgtcgggctg 
X222 X222U ctagcttggagagactttgctgacgc 
X222L catggcgtcagcaaagtctctccaag 
X223 X223U ctagctgcgtgtacgggcttatagac 
X223L catggtctataagcccgtacacgcag 
X22 4 X224U ctagctcttattcgttagccgaggcc 
X224L catgggcctcggctaacgaataagag 
X225 X225U ctagcagccgaacaggacaaaactcc 
X225L catgggagttttgtcctgttcggctg 
X22 6 X226U ctagccatcattaacttcccctggcc 
X226L catgggccaggggaagttaatgatgg 
X227 X227U ctagcccgaactaaatgtcacagcgc 
X227L catggcgctgtgacatttagttcggg 
X228 X228U ctagcgacgcaatcttaaccaacccc 
X228L catgggggttggttaagattgcgtcg 
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X22 9 X22 9U ctagctgtatgcacatcaccgagtgc 
X22 9L catggcactcggtgatgtgcatacag 
X230 X230U ctagccgtctcattctggtcattgcc 
X230L catgggcaatgaccagaatgagacgg 
X231 X231U ctagcaggttgggttcccctatcatc 
X231L catggatgataggggaacccaacctg 
X232 X232U ctagccggttgcttatcaggaatccc 
X232L catggggattcctgataagcaaccgg 
X233 X233U ctagcacggccagtaagtgtccaatc 
X233L catggattggacacttactggccgtg 
X234 X234U ctagcacacctgggcgtgaataactc 
X234L catggagttattcacgcccaggtgtg 
X235 X235U ctagccttgggctcctgctaaaagac 
X235L catggtcttttagcaggagcccaagg 
X236 X236U ctagcgcgacctctaagccttgaaac 
X23 6L catggtttcaaggcttagaggtcgcg 
X237 X237U ctagccaggtttgggggtacatgatc 
X237L catggatcatgtacccccaaacctgg 
X238 X238U ctagctcgttgtctgccctcttgtac 
X238L catggtacaagagggcagacaacgag 
X239 X239U ctagcagacctcggtaaccacgaaac 
X239L catggtttcgtggttaccgaggtctg 
X240 X24 0U ctagcagtaaggtctttgggtgccac 
X24 0L catggtggcacccaaagaccttactg 
X241 X241U ctagcagtagccttgtgggaaccaac 
X241L catggttggttcccacaaggctactg 
X242 X24 2U ctagcgattaacctctcggaatgcgc 
X242L catggcgcattccgagaggttaatcg 
X24 3 X24 3U ctagcgcgatattgttccctgcttcc 
X24 3L catgggaagcagggaacaatatcgcg 
X24 4 X24 4U ctagccaaccgtgttagcgaccatac 
X24 4L catggtatggtcgctaacacggttgg 
X24 5 X24 5U ctagcgaatgggtggtggaaggatac 
X245L catggtatccttccaccacccattcg 
X24 6 X2 4 6U ctagcaccaagtcgctgtcaactgac 
X24 6L catggtcagttgacagcgacttggtg 
X247 X247U ctagccattttcaggaaggagacggc 
X247L catggccgtctccttcctgaaaatgg 
X24 8 X24 8U ctagctggttggactgatacgaacgc 
X24 8L catggcgttcgtatcagtccaaccag 
X24 9 X24 9U ctagcattcacccaatggtctacggc 
X24 9L catggccgtagaccattgggtgaatg 
X250 X250U ctagcggtggtaggcatatccgaaac 
X250L catggtttcggatatgcctaccaccg 
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X251 X251U ctagctgtctgtgaccttgggattgc 

X251L catggcaatcccaaggtcacagacag 

X252 X252U ctagccaagcctcaatgcctaaaggc 

X252L catggcctttaggcattgaggcttgg 

X253 X253U ctagcacttcttacgtcaccgcgatc 

X253L catggatcgcggtgacgtaagaagtg 

X2 54 X254U ctagcggttcctcaccattcggttac 

X254L catggtaaccgaatggtgaggaaccg 

X255 X255U ctagcagagtcaatgtcggttggctc 

X255L catggagccaaccgacattgactctg 
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Name Algomer 

00 tcgaggatatccgggcttcgggtgaccgggatcttaaga 

cctataggcccgaagcccactggccctagaattcttcga 

01 tcgaggatatcccttggcggtgaggcggcgatcttaaga 

cctatagggaaccgccactccgccgctagaattcttcga 

02 tcgaggatatctgtgggctacggggccgcgatcttaaga 

cctatagacacccgatgccccggcgctagaattcttcga 

03 tcgaggatatctaggtggctgcgcggggcgatcttaaga 

cctatagatccaccgacgcgccccgctagaattcttcga 

50 ttaagcgaagtggcctggcgggcgctagcg 

cgcttcaccggaccgcccgcgatcgcttaa 

51 ttaagaacccgagccccggacgggctagcg 

cttgggctcggggcctgcccgatcgcttaa 

52 ttaagcgcaccaggcagagcgcggctagcg 

cgcgtggtccgtctcgcgccgatcgcttaa 

53 ttaagtcctcgtggtcgggcggcgctagcg 

caggagcaccagcccgccgcgatcgcttaa 
EO gatccccatggaatcccttggcggtgaggcggcgatatct 

gggtaccttagggaaccgccactccgccgctatagagatc 
El gatccccatggaatctgtgggctacggggccgcgatatct 

gggtaccttagacacccgatgccccggcgctatagagatc 
E2 gatccccatggaatctaggtggctgcgcggggcgatatct 

gggtaccttagatccaccgacgcgccccgctatagagatc 
E3 gatccccatggaatccgcaagccccaaggccccgatatct 

gggtaccttaggcgttcggggttccggggctatagagatc 
XO ctagcgtatgccctgtagtttggagc 

gcatacgggacatcaaacctcggtac 
XI ctagcgtaaagccaactgtaccctgc 

gcatttcggttgacatgggacggtac 
X2 ctagcgagactaaggttgttggtcgc 

gctctgattccaacaaccagcggtac 
X3 ctagcgttccttcaagtcactcgtcc 

gcaaggaagttcagtgagcagggtac 
X4 ctagccctgcccacagtagaataagc 

gggacgggtgtcatcttattcggtac 
X5 ctagcgaatcaagactcgtgctaccc 

gcttagttctgagcacgatggggtac 
X6 ctagcgatgacagttagacgcttccc 

gctactgtcaatctgcgaaggggtac 
X7 ctagcctcctgaacctaagtcatcgc 

ggaggacttggattcagtagcggtac 
X8 ctagcccaaagttacagacctcagcc 

gggtttcaatgtctggagtcgggtac 
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X9 ctagcgacctatgcaatctactcgcc 

gctggatacgttagatgagcgggtac 
X10 ctagccagtagtaatcttccgcaggc 

ggtcatcattagaaggcgtccggtac 
Xll ctagcctgttggtgggtactcctaac 

ggacaaccacccatgaggattggtac 
X12 ctagcaacgaggtggtacgacatagc 

gttgctccaccatgctgtatcggtac 
X13 ctagccgcagtcattatagagagccc 

ggcgtcagtaatatctctcggggtac 
X14 ctagcgtacttgtccctccagcatac 

gcatgaacagggaggtcgtatggtac 
X15 ctagcatcctgtgtgcctaagtacgc 

gtaggacacacggattcatgcggtac 
X16 ctagcgaggcacttgacgtatgactc 

gctccgtgaactgcatactgaggtac 
X17 ctagcgggatacctttctaagcgacc 

gccctatggaaagattcgctgggtac 
X18 ctagcggataggtcgcagtcttgtac 

gcctatccagcgtcagaacatggtac 
X19 ctagcgtacagtgcgaagagggtaac 

gcatgtcacgcttctcccattggtac 
X20 ctagcgcctccgacacagttactaac 

gcggaggctgtgtcaatgattggtac 
X21 ctagcgtgggtctggaacactattgc 

gcacccagaccttgtgataacggtac 
X22 ctagcaactcctcactgttcactgcc 

gttgaggagtgacaagtgacgggtac 
X23 ctagccgtatggtatatcgtcagccc 

ggcataccatatagcagtcggggtac 
X24 ctagcgcacagaccaaggacattacc 

gcgtgtctggttcctgtaatgggtac 
X25 ctagcctcccactaaacggtcctatc 

ggagggtgatttgccaggataggtac 
X26 ctagccacggaccgagtatctattgc 

ggtgcctggctcatagataacggtac 
X27 ctagcgtctgatgagcgcagttagtc 

gcagactactcgcgtcaatcaggtac 
X28 ctagcgagaatgcggtgatagtgacc 

gctcttacgccactatcactgggtac 
X29 ctagcctacactaaccgacggaatgc 

ggatgtgattggctgccttacggtac 
X30 ctagcaagtccttgttacgagtcccc 

gttcaggaacaatgctcagggggtac 
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X31 ctagcacctgaagttacgggaagtcc 

gtggacttcaatgcccttcagggtac 
X32 ctagcaacaggttccttacagagggc 

gttgtccaaggaatgtctcccggtac 
X33 ctagcacgtagccaagacttatcccc 

gtgcatcggttctgaatagggggtac 
X34 ctagccagtcaggtctattgttgccc 

ggtcagtccagataacaacggggtac 
X35 ctagcgagaaccatattgcccctacc 

gctcttggtataacggggatgggtac 
X36 ctagccataaagaggagactgggctc 

ggtatttctcctctgacccgaggtac 
X37 ctagccatagtctgcgaatactgccc 

ggtatcagacgcttatgacggggtac 
X38 ctagcgttagggcagccttaggtaac 

gcaatcccgtcggaatccattggtac 
X39 ctagcatagatgtgacagtgggacgc 

gtatctacactgtcaccctgcggtac 
X4 0 ctagcgattagagttgtagggcgctc 

gctaatctcaacatcccgcgaggtac 
X41 ctagctggaagtacgtgtgggatagc 

gaccttcatgcacaccctatcggtac 
X42 ctagctgagatagtcgtggatggtcc 

gactctatcagcacctaccagggtac 
X4 3 ctagcacgacctgttaccgttacctc 

gtgctggacaatggcaatggaggtac 
X4 4 ctagccattgctggaactgctactcc 

ggtaacgaccttgacgatgagggtac 
X45 ctagcgtaccccacccacataaagtc 

gcatggggtgggtgtatttcaggtac 
X4 6 ctagcagtgtaggaatacccgtgctc 

gtcacatccttatgggcacgaggtac 
X47 ctagccgttcgctatgttctacagcc 

ggcaagcgatacaagatgtcgggtac 
X4 8 ctagcccctgtccccatacattactc 

ggggacaggggtatgtaatgaggtac 
X4 9 ctagcatgtaggcaactgtcgtcacc 

gtacatccgttgacagcagtgggtac 
X50 ctagcgtatgttcccagcgagtacac 

gcatacaagggtcgctcatgtggtac 
X51 ctagcgtgtaataccacgggtgttgc 

gcacattatggtgcccacaacggtac 
X52 ctagctgtagtggtctttacgtggcc 

gacatcaccagaaatgcaccgggtac 
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X53 ctagcgtcaggtgctcatccagttac 

gcagtccacgagtaggtcaatggtac 
X54 ctagcctccacaaacatacccacacc 

ggaggtgtttgtatgggtgtgggtac 
X55 ctagctgaggtgtcaatgagagaggc 

gactccacagttactctctccggtac 
X56 ctagctcactcctctacgatgaacgc 

gagtgaggagatgctacttgcggtac 
X57 ctagctcgtactgagatgttcctgcc 

gagcatgactctacaaggacgggtac 
X58 ctagctgactctggacttatgacgcc 

gactgagacctgaatactgcgggtac 
X59 ctagcagattacggagtgtgttcccc 

gtctaatgcctcacacaagggggtac 
X60 ctagccttaccactgttgcagaggac 

ggaatggtgacaacgtctcctggtac 
X61 ctagcccgttatccgtactggaagtc 

gggcaataggcatgaccttcaggtac 
X62 ctagcgtttgggtatcggctgtactc 

gcaaacccatagccgacatgaggtac 
X63 ctagcgaggatgaacacaaggaggtc 

gctcctacttgtgttcctccaggtac 
X64 ctagccatagcggatagggttacgtc 

ggtatcgcctatcccaatgcaggtac 
X65 ctagctctcatatccctaacctggcc 

gagagtatagggattggaccgggtac 
X66 ctagcggtattgtctcgtcatgcacc 

gccataacagagcagtacgtgggtac 
X67 ctagcatcacctacctgagattgccc 

gtagtggatggactctaacggggtac 
X68 ctagcgactggggtctgttgtttctc 

gctgaccccagacaacaaagaggtac 
X69 ctagcaggggtcggagttagagaatc 

gtccccagcctcaatctcttaggtac 
X7 0 ctagcaccgaaggatgttgagtctcc 

gtggcttcctacaactcagagggtac 
X71 ctagcggtgatgactcggaacttctc 

gccactactgagccttgaagaggtac 
X72 ctagcgggtacacaaatggaaggtcc 

gcccatgtgtttaccttccagggtac 
X73 ctagcatcatctcgggtctacttcgc 

gtagtagagcccagatgaagcggtac 
X7 4 ctagcaatcagtagacatcgccctcc 

gttagtcatctgtagcgggagggtac 
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X75 ctagccacggaagtctattcacacgc 

ggtgccttcagataagtgtgcggtac 
X76 ctagcaggggctgttacatgaagagc 

gtccccgacaatgtacttctcggtac 
X77 ctagccgtgacctgctgtgatttacc 

ggcactggacgacactaaatgggtac 
X78 ctagcatagtcttagtccggcatcgc 

gtatcagaatcaggccgtagcggtac 
X79 ctagcatcactacctgcctattcgcc 

gtagtgatggacggataagcgggtac 
X80 ctagcttaccttgtctaaccctcgcc 

gaatggaacagattgggagcgggtac 
X81 ctagctcttaatccctctggctgacc 

gagaattagggagaccgactgggtac 
X82 ctagcagacccatccgagtaccatac 

gtctgggtaggctcatggtatggtac 
X83 ctagcagactgaaccctcaagatgcc 

gtctgacttgggagttctacgggtac 
X84 ctagcaggcattctgatactcctcgc 

gtccgtaagactatgaggagcggtac 
X85 ctagcctgcaagagtcatatcacggc 

ggacgttctcagtatagtgccggtac 
X8 6 ctagcgtgggatttcgtctataccgc 

gcaccctaaagcagatatggcggtac 
X87 ctagccagaccgcctcctaatcttac 

ggtctggcggaggattagaatggtac 
X88 ctagcatctccttgcttgtacctcgc 

gtagaggaacgaacatggagcggtac 
X89 ctagctgtgcggctatgtagtcctac 

gacacgccgatacatcaggatggtac 
X90 ctagcagtgtcctaagcaaagacggc 

gtcacaggattcgtttctgccggtac 
X91 ctagcttcccttctaccctgtaccac 

gaagggaagatgggacatggtggtac 
X92 ctagcaaggtgtccagtggtcagatc 

gttccacaggtcaccagtctaggtac 
X93 ctagcatcagcatagggaccacactc 

gtagtcgtatccctggtgtgaggtac 
X94 ctagcggacggccaactatcataagc 

gcctgccggttgatagtattcggtac 
X95 ctagctgaacctctgtgctgtaggac 

gacttggagacacgacatcctggtac 
X96 ctagctgacttcacctggctgtctac 

gactgaagtggaccgacagatggtac 
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X97 ctagctcctaactctattgccgagcc 

gaggattgagataacggctcgggtac 
X98 ctagccttatcctacgcgagcagatc 

ggaataggatgcgctcgtctaggtac 
X99 ctagccgcataagcacatctgtagcc 

ggcgtattcgtgtagacatcgggtac 
X100 ctagcaacgtagagaacgaagccagc 

gttgcatct cttgcttcggtcggtac 
X101 ctagctcacggagtcctgatgtatgc 

gagtgcctcaggactacatacggtac 
X102 ctagcatgtatcccgttggtgtaggc 

gtacatagggcaaccacatccggtac 
X103 ctagcgcctgactattttgacggtcc 

gcggactgataaaactgccagggtac 
X104 ctagcgatagcacttcaaacgtcccc 

gctatcgtgaagttt gcagggggtac 
X105 ctagcgaagtgcattcttaccgtccc 

gcttcacgtaagaatggcaggggtac 
X106 ctagcccttgtcgttctaaactgggc 

gggaacagcaagatttgacccggtac 
X107 ctagcgtttaaggagtgttcgtccgc 

gcaaattcctcacaagcaggcggtac 
X108 ctagccagagttaaagttgccccacc 

ggtctcaatttcaacggggtgggtac 
X109 ctagcgtcagaatcaatctcctggcc 

gcagtcttagttagaggaccgggtac 
X110 ctagcgtgcttgacctgaatccttcc 

gcacgaactggacttaggaagggtac 
Xlll ctagcaccacccttcttcaccctatc 

gtggtgggaagaagtgggataggtac 
X112 ctagccagaaagggcagtcctaatgc 

ggtctttcccgtcaggattacggtac 
X113 ctagcaacccactatcgtacatccgc 

gttgggtgatagcatgtaggcggtac 
XI 14 ctagcgaatacttgggagttgcgagc 

gcttatgaaccctcaacgctcggtac 
XI 15 ctagcggcaataagttcaggctgtcc 

gccgttattcaagtccgacagggtac 
X116 ctagcaagggagcagacagtcatgtc 

gttccctcgtctgtcagtacaggtac 
X117 ctagccataacacacgggacaacacc 

ggtattgtgtgccctgttgtgggtac 
X118 ctagccagaaacgaaggtcctaacgc 

ggtctttgcttccaggattgcggtac 
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XI 19 ctagcgtgccaagccttaatagtgcc 

gcacggttcggaattatcacgggtac 
XI 20 ctagccggatgaggatgtatcaggtc 

ggcctactcctacatagtccaggtac 
XI 21 ctagccgtggcgttaaactcttaggc 

ggcaccgcaatttgagaatccggtac 
XI 22 ctagcctgctcttgatggataaggcc 

ggacgagaactacctattccgggtac 
XI 2 3 .ctagcatcagagtggagagcacgatc 

gtagtctcacctctcgtgctaggtac 
X124 ctagcgcacaggaaatagaagtcgcc 

gcgtgtcctttatcttcagcgggtac 
X125 ctagcccacccgactacagaacaatc 

gggtgggctgatgtcttgttaggtac 
X126 ctagccgagattacccagttgtggtc 

ggctctaatgggtcaacaccaggtac 
X127 ctagccgagttaatagacgcggaagc 

ggctcaattatctgcgccttcggtac 
X128 ctagccgctgcggtttctctattacc 

ggcgacgccaaagagataatgggtac 
X129 ctagctcagccgtaggtcttcaactc 

gagtcggcatccagaagttgaggtac 
X130 ctagcttagtggagcctcttcacgtc 

gaatcacctcggagaagtgcaggtac 
X131 ctagccagagtgtcggccttttaagc 

ggtctcacagccggaaaattcggtac 
X132 ctagcctaaaacttgactcgcggacc 

ggattttgaactgagcgcctgggtac 
X133 ctagcccgtzctggtcggataagatac 

gggcagaccagcctattctatggtac 
X134 ctagcagattggtcacaactccaggc 

gtctaaccagtgttgaggtccggtac 
X135 ctagcaccagaaggttggagaaggtc 

gtggtcttccaacctcttccaggtac 
X136 ctagccacatcttacaccgtcatcgc 

ggtgtagaatgtggcagtagcggtac 
X137 ctagcgcgtcgggacttacaagatac 

gcgcagccctgaatgttctatggtac 
X138 ctagcaggatggtgcaagcatactcc 

gtcctaccacgttcgtatgagggtac 
XI 39 ctagcggacaaactgctggttcctac 

gcctgtttgacgaccaaggatggtac 
XI 4 0 ctagcggttgcctcaaactggagtac 

gccaacggagtttgacctcatggtac 
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X141 

X142 

X143 

X144 

X145 

X146 

X147 

X148 

X149 

X150 

X151 

X152 

X153 

X154 

X155 

X156 

X157 

X158 

X159 

X160 

X161 

X162 



ctagctttgtaagacaccccagagcc 

gaaacattctgtggggtctcgggtac 
ctagcccctttggtcgttagtgctac 

ggggaaaccagcaatcacgatggtac 
ctagcagagggctgagggatagaaac 

gtctcccgactccctatctttggtac 
ctagcagttcgtacctttgacacgcc 

gtcaagcatggaaactgtgcgggtac 
. ctagcgatttgcagtgataccacccc 

gctaaacgtcactatggtgggggtac 
ctagcgagtgtagaatccggctgaac 

gctcacatcttaggccgacttggtac 
ctagcgcaagtccgtgttcctcttac 

gcgttcaggcacaaggagaatggtac 
ctagcctttgtacggtggtgaaaccc 

ggaaacatgccaccactttggggtac 
ctagcactttcatgtggagacgctcc 

gtgaaagtacacctctgcgagggtac 
ctagcaacactaagcggatgtcagcc 

gttgtgattcgcctacagtcgggtac 
ctagcctaactcaactccgcaacgtc 

ggattgagttgaggcgttgcaggtac 
ctagcaagtagatggaaagggtgccc 

gttcatctacctttcccacggggtac 
ctagcgaaatacgaggaacgagggtc 

gctttatgctccttgctcccaggtac 
ctagcgaggctgctaagggaaaaagc 

gctccgacgattccctttttcggtac 
ctagcggacgttatttcacacct cgc 

gcctgcaataaagtgtggagcggtac 
ctagcgacacaagagcctaagccaac 

gctgtgttctcggattcggttggtac 
ctagcgtgtttgtttaccctgccagc 

gcacaaacaaatgggacggtcggtac 
ctagcactgcgtcctcacaaagaagc 

gtgacgcaggagtgtttcttcggtac 
ctagcagtccccgaagtcaaatagcc 

gtcaggggcttcagtttatcgggtac 
ctagcgatacttcccaatgcagacgc 

gctatgaagggttacgtctgcggtac 
ctagcggaactaatgtcatgctgccc 

gccttgattacagtacgacggggtac 
ctagcgcgatggtgataacgtaagcc 

gcgctaccactattgcattcgggtac 
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X163 ctagcctcctgtacggcaaatgttcc 

ggaggacatgccgtttacaagggtac 
X164 ctagcctatttggaccgcacaagacc 

ggataaacctggcgtgttctgggtac 
X165 ctagcatccttgtagcggacacgtac 

gtaggaacatcgcctgtgcatggtac 
X166 ctagcaagtgggaatagggtccgtac 

gttcacccttatcccaggcatggtac 
X167 ctagcgatagaaccgactgcaatgcc 

gctatcttggctgacgttacgggtac 
X168 ctagcgcgaatgaagtggactatgcc 

gcgcttacttcacctgatacgggtac 
X169 ctagccgaactttagcatccgtgacc 

ggcttgaaatcgtaggcactgggtac 
X170 ctagcgttagaaatgtctgcggtcgc 

gcaatctttacagacgccagcggtac 
X171 ctagcgcaccacacgaaagaatctcc 

gcgtggtgtgctttcttagagggtac 
X172 ctagctcacactcttggtcggctatc 

gagtgtgagaaccagccgataggtac 
X173 ctagctcactctggccgaactgtatc 

gagtgagaccggcttgacataggtac 
X17 4 ctagctggagaacggtcttgtctgtc 

gacctcttgccagaacagacaggtac 
X175 ctagcaggtatcgcgtccctaatgtc 

gtccatagcgcagggattacaggtac 
X176 ctagctggctcactacacgaacatgc 

gaccgagtgatgtgcttgtacggtac 
X177 ctagcgtaccagtgaaatcgggacac 

gcatggtcactttagccctgtggtac 
X178 ctagccgaagaacaacatcagagccc 

ggcttcttgttgtagtctcggggtac 
X179 ctagcgggtccaatcctaaagcaagc 

gcccaggttaggatttcgttcggtac 
X180 ctagcttgagcagaagaactctcgcc 

gaactcgtcttcttgagagcgggtac 
X181 ctagcattgccgtggtgtaactacgc 

gtaacggcaccacattgatgcggtac 
X182 ctagccgcatacgttctgtgcagtac 

ggcgtatgcaagacacgtcatggtac 
X183 ctagccagcgatatggtggtgctatc 

ggtcgctataccaccacgataggtac 
XI 8 4 ctagccgtaacacccagagattggac 

ggcattgtgggtctctaacctggtac 
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X190 
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X200 

X201 

X202 

X203 

X204 

X205 

X206 



ctagctccacgataactcacaagggc 

gaggtgctattgagtgttcccggtac 
ctagctcacttccctggtcgtaatgc 

gagtgaagggaccagcattacggtac 
ctagcgcgttgtcacctaatacggac 

gcgcaacagtggattatgcctggtac 
ctagcatgttacactcgcatccgacc 

gtacaatgtgagcgtaggctgggtac 
ctagcatgtagccagtgattgtgccc 

gtacatcggtcactaacacggggtac 
ctagcaagatgcagagtctaccgcac 

gttctacgtctcagatggcgtggtac 
ctagcagaccgctctatcacaagcac 

gtctggcgagatagtgttcgtggtac 
ctagcagggaggtccagaatcttcac 

gtccctccaggtcttagaagtggtac 
ctagcttagaccagcactgcgaagtc 

gaatctggtcgtgacgcttcaggtac 
ctagcccgaggcgtgactatacaaac 

gggctccgcactgatatgtttggtac 
ctagcgacaacctacaaacgctccac 

gctgttggatgtttgcgaggtggtac 
ctagccgtcattcgtcagaccagatc 

ggcagtaagcagtctggtctaggtac 
ctagcagatgagtgacgatggttgcc 

gtctactcactgctaccaacgggtac 
ctagcacccacaaccaggaaaagtcc 

gtgggtgttggtccttttcagggtac 
ctagctgaggcatctttggagtacgc 

gactccgtagaaacctcatgcggtac 
ctagctgtaatcggtctcaggcaagc 

gacattagccagagtccgttcggtac 
ctagcctacagtcggattggctcaac 

ggatgtcagcctaaccgagttggtac 
ctagccttcaaggacctcgtgcatac 

ggaagttcctggagcacgtatggtac 
ctagcggcaggataaagtgctgacac 

gccgtcctatttcacgactgtggtac 
ctagcgcctggacggttaaaggttac 

gcggacctgccaatttccaatggtac 
ctagctgtccaagtaccaaagagcgc 

gacaggttcatggtttctcgcggtac 
ctagctgcacactgggtctaacacac 

gacgtgtgacccagattgtgtggtac 
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X209 
X210 
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X212 
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X224 
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X228 



ctagcaatctgtcgcctgcatagtgc 

gttagacagcggacgtatcacggtac 
ctagccccttcgctcttctttcatcc 

ggggaagcgagaagaaagtagggtac 
ctagcaagatattctcccacgaccgc 

gttctataagagggtgctggcggtac 
ctagcggtttctgcactacagccaac 

gccaaagacgtgatgtcggttggtac 
ctagcaaaggcatcggacatcctacc 

gtttccgtagcctgtaggatgggtac 
ctagcacgaagtatgcgttgtgagcc 

gtgcttcatacgcaacactcgggtac 
ctagcggacatcggatttggataccc 

gcctgtagcctaaacctatggggtac 
ctagccggtacttttgcgactctgac 

ggccatgaaaacgctgagactggtac 
ctagcgttaccgctcaccgaaatctc 

gcaatggcgagtggctttagaggtac 
ctagcaagaagacgatgtgtgctcgc 

gttcttctgctacacacgagcggtac 
ctagcggctattcattctcgccctac 

gccgataagtaagagcgggatggtac 
ctagcaagggaatgtcagttctgccc 

gttcccttacagtcaagacggggtac 
ctagcggcttgttaggccgttaagac 

gccgaacaatccggcaattctggtac 
ctagcaaggatagagatgccgttgcc 

gttcctatctctacggcaacgggtac 
ctagcagcccgacatgacagatacac 

gtcgggctgtactgtctatgtggtac 
ctagcttggagagactttgctgacgc 

gaacctctctgaaacgactgcggtac 
ctagctgcgtgtacgggcttatagac 

gacgcacatgcccgaatatctggtac 
ctagctcttattcgttagccgaggcc 

gagaataagcaatcggctccgggtac 
ctagcagccgaacaggacaaaactcc 

gtcggcttgtcctgttttgagggtac 
ctagccatcattaacttcccctggcc 

ggtagtaattgaaggggaccgggtac 
ctagcccgaactaaatgtcacagcgc 

gggcttgatttacagtgtcgcggtac 
ctagcgacgcaatcttaaccaacccc 

gctgcgttagaattggttgggggtac 
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X22 9 ctagctgtatgcacatcaccgagtgc 

gacatacgtgtagtggctcacggtac 
X230 ctagccgtctcattctggtcattgcc 

ggcagagtaagaccagtaacgggtac 
X231 ctagcaggttgggttcccctatcatc 

gtccaacccaaggggatagtaggtac 
X232 ctagccggttgcttatcaggaatccc 

ggccaacgaatagtccttaggggtac 
X233 ctagcacggccagtaagtgtccaatc 

gtgccggtcattcacaggttaggtac 
X234 ctagcacacctgggcgtgaataactc 

gtgtggacccgcacttattgaggtac 
X235 ctagccttgggptcctgctaaaagac 

ggaacccgaggacgattttctggtac 
X236 ctagcgcgacctctaagccttgaaac 

gcgctggagattcggaactttggtac 
X237 ctagccaggtttgggggtacatgatc 

ggtccaaacccccatgtactaggtac 
X238 ctagctcgttgtctgccctcttgtac 

gagcaacagacgggagaacatggtac 
X239 ctagcagacctcggtaaccacgaaac 

gtctggagccattggtgctttggtac 
X24 0 ctagcagtaaggtctttgggtgccac 

gtcattccagaaacccacggtggtac 
X241 ctagcagtagccttgtgggaaccaac 

gtcatcggaacacccttggttggtac 
X24 2 ctagcgattaacctctcggaatgcgc 

gctaattggagagccttacgcggtac 
X24 3 ctagcgcgatattgttccctgcttcc 

gcgctataacaagggacgaagggtac 
X24 4 ctagccaaccgtgttagcgaccatac 

ggttggcacaatcgctggtatggtac 
X24 5 ctagcgaatgggtggtggaaggatac 

gcttacccaccaccttcctatggtac 
X24 6 ctagcaccaagtcgctgtcaactgac 

gtggttcagcgacagttgactggtac 
X24 7 ctagccattttcaggaaggagacggc 

ggtaaaagtccttcctctgccggtac 
X24 8 ctagctggttggactgatacgaacgc 

gaccaacctgactatgcttgcggtac 
X24 9 ctagcattcacccaatggtctacggc 

gtaagtgggttaccagatgccggtac 
X250 ctagcggtggtaggcatatccgaaac 

gccaccatccgtataggctttggtac 
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X251 ctagctgtctgtgaccttgggattgc 

gacagacactggaaccctaacggtac 
X252 ctagccaagcctcaatgcctaaaggc 

ggttcggagttacggatttccggtac 
X253 ' ctagcacttcttacgtcaccgcgatc 

gtgaagaatgcagtggcgctaggtac 
X254 ctagcggttcctcaccattcggttac 

gccaaggagtggtaagccaatggtac 
X255 ctagcagagtcaatgtcggttggctc 

gtctcagttacagccaaccgaggtac 
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(57) Abstract: The invention relates to 
methods for producing information-car- 
rying polymers, information-carrying 
polymers obtained using these methods, 
and to methods for isolating, duplicating, 
and selecting such information-carrying 
polymers. The invention also relates 
to polymeric data memories and 
DNA computers which contain the 
infonriation-carrying polymers, and to the 
use of mfonnation-carrying polymers for 
producing molecular weight standards, 
as markers or signatures, for encoding 
information, as molecular-scale adhesives, 
or for producing or processing the smallest 
molecular structures. 

(57) Zusammenfassung: Die Erfindung 
betrifft Verfahren zur Herstellung infor- 
mationstragender Polymere, nach diesen 
Verfahren erhaltliche informationstragende 
Polymere; Verfahren zur Isolierung, zur 
Vervielfaltigung und zum Auslesen solcher 
informations tragender Polymere; polymere 
Datenspeicher und DNA-Computer, die 
informationstragende Polymere umfassen 
sowie die Verwendung informationstra- 
gender Polymere zur Herstellung von 
Molekulargewichtsstandards, als Marker 
oder Signaturen, zur Verschlusselung von 
Information, als molekulare Kleber oder 
zur Herstellung oder Bearbeitung kleinster 
molekularer Strukturen. 
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